首页> 中国专利> 作为2型糖尿病风险诊断标记物的TCF7L2基因的遗传变异体

作为2型糖尿病风险诊断标记物的TCF7L2基因的遗传变异体

摘要

关联分析显示基因TCF7L2多态性是II型糖尿病的易感基因。本文描述了糖尿病易感性的诊断方法,糖尿病易感性降低的诊断方法和预防糖尿病的方法,以及II型糖尿病的治疗方法。

著录项

  • 公开/公告号CN101238222A

    专利类型发明专利

  • 公开/公告日2008-08-06

    原文格式PDF

  • 申请/专利权人 解码遗传学私营有限责任公司;

    申请/专利号CN200680022129.6

  • 发明设计人 斯特鲁安·F·A·格兰特;

    申请日2006-06-16

  • 分类号C12Q1/68(20060101);A61P3/10(20060101);

  • 代理机构11219 中原信达知识产权代理有限责任公司;

  • 代理人杨青;樊卫民

  • 地址 冰岛雷克雅末

  • 入库时间 2023-12-17 20:32:26

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-05-27

    未缴年费专利权终止 IPC(主分类):C12Q 1/68 专利号:ZL2006800221296 申请日:20060616 授权公告日:20130410

    专利权的终止

  • 2013-04-10

    授权

    授权

  • 2008-10-01

    实质审查的生效

    实质审查的生效

  • 2008-08-06

    公开

    公开

说明书

发明背景

糖尿病,一种糖利用减少、脂和蛋白利用增加的代谢疾病,由胰 岛素的绝对或者相对缺乏引起。在更严重的情况下,糖尿病的特点在 于长期高血糖,糖尿,水和电解质损失,酮酸中毒和昏迷。长期并发 症包括神经病变、视网膜病、肾病、大小血管全身退行性病变的发展 和感染易感性的增加。糖尿病最常见的类型是II型,非胰岛素依赖型 糖尿病,其特征在于高血糖由受损的胰岛素分泌和靶组织中胰岛素抵 抗造成。遗传和环境因素都对这种疾病有作用。例如,肥胖在疾病发 展过程中起着重要作用。II型糖尿病经常是渐进发病糖尿病的温和形 式。

II型糖尿病对健康的影响是巨大的。在1995年,全球范围内存在 1亿3500万成年糖尿病患者。预计在2025年接近3亿人将患有糖尿病 (King H.,等人,Diabetes Care,21(9):1414-1431(1998))。在冰岛,成年群 体中II型糖尿病的患病率是2.5%(Vilbergsson,S.,等人,Diabet.Med., 14(6):491-498(1997)),这包括大约5,000个年龄在34岁以上患有这种 疾病的人。这种疾病的高患病率和增加的患病人口数目显示,更精确 界定涉及II型糖尿病的遗传因素以定义相关风险系数的医疗需要还没 有得到满足。还需要用于预防II型糖尿病的治疗剂。

发明概述

本发明涉及通过评估某些与TCF7L2基因(转录因子7-样2(T- 细胞特定的,HMG-盒),过去称为TCF4基因(T-细胞转录因子4)) 有关的标记物或者单倍型,诊断II型糖尿病易感性增加的方法,以及 诊断II型糖尿病易感性降低或者诊断对II型糖尿病的防护的方法。该 方法包括检测与TCF7L2基因外显子4LD块相关的遗传标记物。

第一个方面,本发明涉及在个体中诊断II型糖尿病易感性的方法, 包括对从个体获得的核酸样品进行与TCF7L2外显子4LD块相关的标 记物或者单倍型的分析,其中标记物或者单倍型的存在指示II型糖尿 病易感性。在一个实施方式中,标记物或者单倍型包括至少一种选自 表6所列的标记物。在另一种实施方式中,标记物或者单倍型是标记 物。

在一个优选的实施方式中,标记物或者单倍型指示II型糖尿病易 感性的增加。易感性增加存在于一个实施方式中,表征为相对危险度 至少为1.2,包括相对危险度至少为1.3和相对危险度至少为1.4。在一 个实施方式中,标记物选自DG10S478,rs12255372,rs7895340, rs11196205,rs7901695,rs7903146,rs12243326,和rs4506565,其中 DG10S478的非-0等位基因(例如,-4,4,8,12,16,20,或者其他非-0等 位基因),rs 12255372的T等位基因;rs7895340的A等位基因; rs11196205的C等位基因;rs7901695的C等位基因rs7903146的T 等位基因;rs12243326的C等位基因;或者rs4506565的T等位基因 的存在,指示II型糖尿病易感性的增加。在一个优选的实施方式中, 标记物选自DG10S478和rs7903146,其中DG10S478的非-0等位基因 或者rs7903146的T等位基因的存在指示II型糖尿病易感性的增加。 在另一个优选的实施方式中,标记物是rs7903146,其中rs7903146的 T等位基因的存在指示II型糖尿病易感性的增加。

在另一个优选的实施方式中,标记物或者单倍型指示II型糖尿病 易感性降低。易感性的降低存在于一个实施方式中,表征为相对危险 度小于0.8,包括相对危险度小于0.7。在一个实施例中,标记物选自 DG10S478,rs12255372,rs7895340,rs11196205,rs7901695,rs7903146, rs12243326,和rs4506565,其中DG10S478的0等位基因,SNP rs12255372的G等位基因;rs7895340的G等位基因;rs11196205的G 等位基因;rs7901695的T等位基因;rs7903146的C等位基因; rs12243326的T等位基因;或者rs4506565的A等位基因的存在,指 示II型糖尿病易感性降低。在一个优选的实施方式中,标记物是 DG10S478,其中DG10S478的0等位基因的存在指示II型糖尿病易感 性降低。在另一个优选的实施方式中,标记物是rs7903146,其中 rs7903146的C等位基因的存在指示II型糖尿病易感性降低。

第二个方面,本发明涉及一种分析来自个体的样品以检测II型糖 尿病易感性的试剂盒,其中所述试剂盒包括用于检测与TCF7L2外显子 4LD块相关的一种或者多种标记物一或者多种的试剂。在一个实施方 式中,一种或者多种试剂包括至少一种连续核苷酸序列,所述核苷酸 序列与包括至少一种标记物的区域完全互补,所述标记物与TCF7L2 外显子4LD块相关。在一个实施方式中,一或者多种标记物选自 DG10S478,rs12255372,rs7895340,rs11196205,rs7901695,rs7903146, rs12243326,和rs4506565。在一个优选的实施方式中,一或者多种标 记物是DG10S478或者rs7903146。在另一个优选的实施方式中,标记 物是rs7903146的C等位基因。

另一方面,本发明涉及一种评定个体对TCF7L2治疗剂反应可能 性的方法,包括:检测与TCF7L2外显子4LD块相关的标记物,其中 所述标记物存在指示对TCF7L2治疗剂阳性反应的可能性。在一个实施 方式中,标记物选自DG10S478,rs12255372,rs7895340,rs11196205, rs7901695,rs7903146,rs12243326,和rs4506565。在另一个实施方式中, 标记是标记物DG10S478或者标记物rs7903146,其中DG10S478的非 -0等位基因或者rs7903146的T等位基因的存在指示对TCF7L2治疗剂 阳性反应的可能性。

本发明的另一个方面涉及利用TCF7L2治疗剂制备治疗II型糖尿 病的药物。在一个实施方式中,TCF7L2治疗剂是一种改变Wnt信号途 径或者钙粘蛋白途径中活性的药剂。在另一个实施例中,TCF7L2治疗 剂是一种选自药剂表中所列的组中的药剂。

附图简述

根据下列对本发明优选实施例更详细的说明,本发明的上述和其 他目标、特征和优点将更容易理解。

图1描述了在HapMap project Build 16中感兴趣的TCF7L2区域相 对SNPs的连锁不平衡(LD)。215.9kb基因跨越7个LD块,如黑色 箭头示意图所示(根据NCBI RefSeq),箭头显示转录的方向;外显子 被标识,外显子4被加亮。DG10S478位于染色体10上TCF7L2基因 内含子3内的114.46Mb(NCBI Build 34),在包括内含子3的一部分、 外显子4的全部和内含子4的一部分的74.9kb块内(此处称为″TCF7L2 外显子4LD块″)。等距而不是根据其物理位置绘制SNP标记物的曲 线。图显示LD的两个检测值-即D′(图左上部分)和r2(右下部分)。

发明详述

下面是本发明优选实施方式的说明。

与II型糖尿病相关的基因座

II型糖尿病的特点在于高血糖,这可能通过例如受损的胰岛素分 泌、周边组织中胰岛素抵抗和肝脏中增加的葡萄糖排出等机制发生。 大多数II型糖尿病患者患有长期高血糖的严重并发症,包括肾病、神 经病变、视网膜病和心血管疾病的加速发展。当前世界范围II型糖尿 病的患病率是6%,但预计在未来十年将会上升(1)。II型糖尿病患 病率的这种增加归因于人口年龄的增加和肥胖的上升。

有证据说明遗传组分与患II型糖尿病风险有关,包括不同种族的 组间患病率的差异(2,3),单卵双生比异卵双生双胞胎更高的同病 率(4,5)和欧洲人群中II型糖尿病的同胞(sibling)相对危险度(λ s)大约为3.5(6)。

迄今为止存在两种用于寻找II型糖尿病相关基因的方法。候选基 因内的单核苷酸多态性(SNPs)已经被用于检测相关性,并且通常, 不被复制或者只造成II型糖尿病轻型风险-最广泛报道的是过氧物酶 体增殖物激活的受体gamma基因(PPARG2)中保护性的Pro 12AIa多 态性(7)和内向矫正性钾通道,亚族J,成员11基因(KIR6.2)的风 险多态性(8)。

在患有常见型II型糖尿病家族中进行基因组范围的连锁扫描已经 得到几个基因座,国际科研社团的主要注意力集中于许多人群中观察 到的染色体1、12和20上的基因座(6)。这些基因座内的基因还有 待发掘。但是,在墨西哥裔美国人中,从染色体2q的基因座分离出钙 蛋白酶10(CAPN10)基因;这代表迄今为止通过位置克隆鉴定的与常 见型II型糖尿病有关的唯一基因(9)。罕见的孟德尔型II型糖尿病, 即青年发病的成人型糖尿病(MODY),通过位置克隆获得6个基因 (6)。

我们过去报道了在冰岛人群中染色体5q与II型糖尿病基因组范围 的显著连锁(10);在相同的研究中,我们还报道与10q和12q连锁 的指示性证据。在墨西哥裔美国人中也观察到与10q区域的连锁(11)。

与II型糖尿病相关的转录因子7-样2基因(TCF7L2)

本发明涉及编码T-细胞转录因子4(TCF4-官方基因命名TCF7L2) 基因内II型糖尿病相关LD块(“TCF7L2外显子4LD块”)的鉴定。 TCF7L2外显子4LD块内的几个标记物,包括微卫星DG10S478和SNP 标记物rs7903146和rs12255372,已经被发现与II型糖尿病有关。最先 在冰岛群体中发现DG10S478相关性(P=1.3×10-9;相对危险度=1.45; 人群归因危险度=22.7%)的原始观察,随后在丹麦II型糖尿病群体和 美国白种人群体中得到重复。DG10S478位于10q25.2上TCF7L2基因 的内含子3中,在明确限定的74.9kb LD块内,所述LD块包含内含子 3的一部分,外显子4的全部和内含子4的一部分。TCF7L2基因产物 是一种包含高迁移率族(HMG)盒的转录因子,它在Wnt信号途径亦 称为APC3/β-连环蛋白/TCF途径中起作用。通过Wnt途径成员β-连 环蛋白和糖原合酶激酶-3beta,TCF7L2介导胰高血糖素原基因表达(血 液葡萄糖稳态中的关键成员)细胞类型-特定的调节(12)。此外,通 过抑制生脂转录因子CCAAT/增强子结合蛋白alpha(C/EBPalpha)和 过氧物酶体增殖物激活的受体gamma(PPARgamma),Wnt信号维持 前成脂肪细胞在未分化状态(13)。当前成脂肪细胞中的Wnt信号被 显性失活TCF7L2的过表达阻止时,这些细胞分化成脂肪细胞(13)。 此外,有报道称,通过与结肠癌细胞中的β-连环蛋白和TCF7L2的物 理相互作用,Wnt/β-连环蛋白信号途径以PPARgamma活性作为靶标 (14)。多功能β-连环蛋白对通过结合钙粘蛋白介导细胞粘着也很重 要(15)。

作为这些发现的结果,现在已有II型糖尿病易感性的诊断方法, 以及II型糖尿病易感性降低的诊断方法和/或对II型糖尿病的防护的方 法。在本发明优选的实施方式中,诊断方法用于鉴定特定等位基因的 存在,包括标记物DG10S478的0等位基因(与II型糖尿病易感性降 低相关,是保护性抵抗II型糖尿病的等位基因);标记物DG10S478 的非-0等位基因(例如,-4,4,8,12,16或者20,或者其他等位基 因)(与II型糖尿病易感性相关)SNP rs12255372的G等位基因(与 II型糖尿病易感性降低相关,是保护性抵抗II型糖尿病的等位基因); SNP rs12255372的T等位基因(与II型糖尿病易感性相关)SNP rs7895340的G等位基因(与II型糖尿病易感性降低相关,是保护性抵 抗II型糖尿病的等位基因);SNP rs7895340的A等位基因(与II型 糖尿病易感性相关)SNP rs11196205的G等位基因(与II型糖尿病 易感性降低相关,是保护性抵抗II型糖尿病的等位基因);SNP rs11196205的C等位基因(与II型糖尿病易感性相关);SNP rs7901695 的T等位基因(与II型糖尿病易感性降低相关,是保护性抵抗II型糖 尿病的等位基因);SNP s7901695的C等位基因(与II型糖尿病易感 性相关)SNPrs7903146的C等位基因(与II型糖尿病易感性降低相 关,是保护性抵抗II型糖尿病的等位基因);SNP rs7903146的T等位 基因(与II型糖尿病易感性相关);SNP rs12243326的C等位基因(与 II型糖尿病易感性相关);和SNP rs4506565的T等位基因(与II型 糖尿病易感性相关)。在本发明的其他实施方式中,利用本文所述的 方法鉴定的其他标记物或者SNPs,可用于II型糖尿病易感性的诊断, 还可用于II型糖尿病易感性降低的诊断或者用于鉴定保护性抵抗II型 糖尿病的等位基因。下面介绍的诊断分析方法可用于鉴定这些特定特 定等位基因的存在或者缺失。

诊断分析

诸如本文所述的那些核酸、探针、引物和抗体可用于II型糖尿病 易感性的各种诊断方法,以及试剂盒(例如,用于II型糖尿病易感性 的诊断)。类似地,本文所述的核酸、探针、引物和抗体可用于II型 糖尿病易感性降低的各种诊断方法,以及保护性抵抗II型糖尿病的诊 断方法和试剂盒。一方面,试剂盒包括可用于扩增感兴趣的标记物的 引物。

在本发明的一个方面,通过检测本文所述的TCF7L2核酸的多态 性(例如,标记物DG10S478或者SNP rs12255372,rs7895340, rs11196205,rs7901695,rs7903146,rs12243326,rs4506565内的等位 基因),进行II型糖尿病易感性的诊断。多态性可以是TCF7L2核酸 的改变,例如单个核苷酸或者不止一个核苷酸的插入或者缺失,导致 移码;至少一个核苷酸的改变,导致编码的氨基酸的改变;至少一个 核苷酸的改变,导致终止密码子的提前产生;几个核苷酸的缺失,导 致核苷酸编码的一个或者多个氨基酸的缺失;一个或者几个核苷酸的 插入,例如通过不等重组或者基因转换,导致基因编码序列的中断; 全部或者部分基因的重复;全部或者部分基因的转座;或者全部或者 部分基因的重排。单个基因可以存在不止一种的这类改变。这类序列 改变引起TCF7L2核酸编码多肽的差异。例如,如果差异是移码改变, 移码可能导致编码氨基酸的改变,和/或可能导致终止密码子的提前产 生,产生截短多肽。此外,与疾病或者病症相关的多态性,或者对与 TCF7L2核酸相关的疾病或者病症相关的易感性,可能是一个或者多个 核苷酸的同义突变(即,不导致TCF7L2核酸编码多肽改变的突变)。 这类多态性可以改变剪接位点,影响mRNA的稳定性或者转运,或者 影响基因的转录或者翻译。具有上述任意改变或者突变的TCF7L2核酸 在此处被称为“突变的核酸”。

在诊断II型糖尿病易感性的第一种方法中,可以使用杂交方法, 例如Southern分析,Northern分析或者原位杂交(参见Current Protocols in Molecular Biology,Ausubel,F.等人,eds,John Wiley & Sons,包括 1999年所有增引)。例如,来自待测患者(“待测个体”)基因组DNA、 RNA或者cDNA的生物样品(“待测样品”),取自个体(RNA和cDNA 只能用于外显子标记物),例如怀疑患有II型糖尿病、对II型糖尿病 敏感或者易感,或者携带II型糖尿病缺陷的个体。个体可能是成年人, 儿童,或者胎儿。待测样品可以来自任何来源,包括基因组DNA,例 如血液样品,羊水样品,脑脊液样品,或者皮、肌肉、口腔或者结膜 粘膜、胎盘、胃肠道或者其他器官的组织样品。通过适当方法,例如 通过羊膜穿刺术或者绒膜绒毛取样,可以获得来自胎儿细胞或者组织 的DNA待测样品。然后检测DNA、RNA或者cDNA样品,确定TCF7L2 核酸是否存在多态性,和/或确定存在何种TCF7L2编码的剪接变体。 通过基因组DNA、RNA或者cDNA内基因与核酸探针的杂交,可以显 示多态性或者剪接变体的存在。此处使用的“核酸探针”,可以是DNA 探针或者RNA探针;核酸探针可以包含,例如至少一个TCF7L2核酸 多态性和/或包含编码TCF7L2核酸特定剪接变体的核酸。探针可以是 上述任意的核酸分子(例如,基因或者核酸,片段,包括基因或者核 酸的载体,探针或者引物,等等)。

为诊断II糖尿病型的易感性,将包含TCF7L2核酸的待测样品与 至少一种核酸探针接触,形成杂交样品。优选的检测mRNA或者基因 组DNA的探针是能够与本文所述的mRNA或者基因组DNA序列杂交 的标记核酸探针。核酸探针可以是,例如,全长核酸分子,或者其一 部分,例如长度至少为15、30、50、100、250或者500个核苷酸并且 在严谨条件下能够与合适的mRNA或者基因组DNA特定杂交的寡聚 核苷酸。用于本发明诊断方法的合适探针如上所述(参见例如,在标 题“本发明的核酸”下描述的探针和引物)。

杂交样品保存在允许核酸探针与TCF7L2核酸特定杂交的条件下。 此处使用的“特定杂交”表示准确杂交(例如,没有错配)。特定杂 交可以在高度严谨条件或者中度严谨条件下进行,例如上面所述。在 特别优选的方面,用于特定杂交的杂交条件是高严谨性。

如果存在特定杂交,则利用标准方法检测。如果核酸探针和待测 样品的TCF7L2核酸之间发生特定杂交,则TCF7L2具有多态性,或者 是存在于核酸探针中的剪接变体。在该方法中可以同时使用不止一个 核酸探针。任意一个核酸探针的特定杂交指示TCF7L2核酸的多态性, 或者编码特定剪接变体的TCF7L2核酸的存在,可用于诊断II型糖尿 病易感性,或者用于诊断II型糖尿病易感性的降低(或者指示抵抗II 型糖尿病的保护性等位基因)。

在Northern分析(参见Current Protocols in Molecular Biology, Ausubel,F.等人,eds.,John Wiley & Sons,supra)中,上述杂交方法被 用于鉴定多态性或者特定剪接变体的存在,所述多态性或者特定剪接 变体与II型糖尿病易感性相关或者与II型糖尿病易感性降低相关。对 Northern分析,RNA待测样品通过适当方法取自个体。如上所述的核 酸探针与个体RNA的特定杂交提示TCF7L2核酸的多态性,或者 TCF7L2核酸编码的特定剪接变体的存在,因此可用于诊断II型糖尿病 易感性,或者II型糖尿病易感性的降低(或者指示抵抗II型糖尿病的 保护性等位基因)。

使用核酸探针的典型实例,参见,例如,美国专利号5,288,611和 4,851,330。

此外,在上述杂交方法中可使用肽核酸(PNA)探针替代核酸探 针。PNA是一种DNA模拟物,具有肽-样无机骨架,例如N-(2-氨基乙 基)甘氨酸单位,一种有机碱(A,G,C,T或者U)通过甲叉羰基接 头与甘氨酸上的氮连接(参见,例如,Nielsen,P.E.等人,Bioconjugate Chemistry 5,American Chemical Society,p.1(1994))。可以设计PNA 探针与TCF7L2核酸特定杂交。PNA探针与TCF7L2核酸的杂交可以 用于诊断II型糖尿病的易感性或者II型糖尿病易感性的降低(或者指 示抵抗II型糖尿病的保护性等位基因)。

在本发明的另一种方法中,如果基因的改变(突变)或者多态性 导致限制性内切位点的产生或者消失,利用限制性消化的突变分析可 用于检测基因突变。包括基因组DNA的待测样品从个体获得。聚合酶 链式反应(PCR)可用于扩增来自待测个体测试样品基因组DNA中的 TCF7L2核酸(和,必要时,侧翼序列)。按所述(参见Current Protocols in Molecular Biology,supra)进行RFLP分析。相关DNA片段的消化 模式提示TCF7L2核酸突变或者多态性的存在或者缺失,因此指示II 型糖尿病易感性或者II型糖尿病易感性降低(或者指示抵抗II型糖尿 病的保护性等位基因)的存在或者缺失。

也可以用序列分析检测TCF7L2核酸的特定多态性。DNA或者 RNA待测样品取自待测个体。如果需要,也可以用PCR或者其他合适 的方法扩增基因或者核酸,和/或其侧翼序列。利用标准方法检测 TCF7L2核酸序列,或者核酸的片段,或者cDNA,或者cDNA的片段, 或者mRNA,或者mRNA的片段。根据情况,将核酸,核酸片段,cDNA, cDNA片段,mRNA或者mRNA片段的序列与基因或者cDNA或者 mRNA的已知核酸序列比较。TCF7L2多态性的存在指示个体具有II 型糖尿病易感性或者II型糖尿病易感性的降低(或者指示抵抗II型糖 尿病的保护性等位基因)。

通过利用扩增寡聚核苷酸与等位基因-特定寡聚核苷酸(ASO)探 针的斑点杂交,也可以使用等位基因-特定寡聚核苷酸检测TCF7L2核 酸多态性的存在(参见,例如,Saiki,R.等人,Nature 324:163-166 (1986))。“等位基因-特定寡聚核苷酸”(此处也称为“等位基因-特 定寡聚核苷酸探针”)是大约10-50碱基对的寡聚核苷酸,优选的大约 15-30碱基对,所述寡聚核苷酸与TCF7L2核酸特定杂交,并且包括与 II型糖尿病易感性相关的多态性或者与II型糖尿病易感性降低(或者 指示抵抗II型糖尿病保护性等位基因)相关的多态性。利用标准方法 (参见Current Protocols in Molecular Biology,supra)可以制备对特定 TCF7L2核酸多态性特定的等位基因-特定寡聚核苷酸探针。为鉴定与 II型糖尿病相关基因的多态性,从个体获得DNA待测样品。PCR可用 于扩增TCF7L2核酸及其侧翼序列的全部或者片段。利用标准方法(参 见Current Protocols in Molecular Biology,supra),包括扩增TCF7L2 核酸(或者基因或者核酸的片段)的DNA被斑点印迹,斑点与寡聚核 苷酸探针接触。然后检测探针与扩增的TCF7L2核酸特定杂交的存在。 等位基因-特定寡聚核苷酸探针与个体DNA的杂交提示TCF7L2核酸多 态性,因此指示II型糖尿病易感性或者指示II型糖尿病易感性的降低 (或者指示抵抗II型糖尿病的保护性等位基因)。

本发明还提供与基因或者核酸的对照或者变异等位基因杂交的等 位基因-特定寡聚核苷酸,所述基因或者核酸包括单核苷酸多态性或者 与其互补。这些寡聚核苷酸可以是探针或者引物。

等位基因-特定引物与靶DNA重叠多态性的位点杂交,只起始引 物显示完全互补的等位基因形式的扩增。参见Gibbs,Nucleic Acid Res. 17,2427-2448(1989)。这种引物与第二引物联用,所述第二引物在远端 位点杂交。扩增起始于两个引物,产生可检测的产物,这提示存在特 定等位基因形式。通常用第二对引物作为对照,其中一个在多态性位 点显示单个碱基错配,另一个显示与远端位点的完全互补。单碱基错 配阻止扩增,没有可检测的产物形成。当错配包括在与多态性比对的 寡聚核苷酸的3′-最远端位置内,这种方法最适用,因为这个位置对从 引物延伸是最具不稳定作用的(参见,例如,WO93/22456)。

通过添加这种类似物作为锁核酸(LNAs),引物和探针的大小可 以减少到只有8个碱基。LNAs是双环DNA类似物一个新的类型,其 中呋喃糖环的2′和4′位置通过O-甲叉(氧-LNA),S-甲叉(硫-LNA) 或者氨基甲叉(氨基-LNA)基团连接。所有这些LNA变异体的共同 点是对互补核酸的亲和力,据报道迄今为止这是DNA类似物中最高的。 例如,在分别与互补DNA或者RNA的复合物中,特定的所有氧-LNA 九聚物分别具有64EC和74EC的熔解温度,与此相对,相应DNA九 聚物的DNA和RNA的熔解温度均是28EC。当LNA单体与标准DNA 或者RNA单体联用时,Tm也有显著增加。对于引物和探针,根据在 何处包括LNA单体(例如,3′端,5′端,或者在中间),Tm可以显著 增加。

另一方面,与个体靶核酸序列片段互补的寡聚核苷酸探针的阵列 可用于鉴定TCF7L2核酸多态性。例如,一方面,可以使用寡聚核苷酸 阵列。寡聚核苷酸阵列通常包括大量不同的寡聚核苷酸探针,所述探 针偶联在底物表面不同的已知位置。这些寡核苷酸阵列,也称为 “GenechipsTM”,在本领域中被广泛描述,例如美国专利号5,143,854 和PCT专利公开号WO 90/15070和92/10092。通常利用机械合成法或 者光导向的合成法,包括照相平版印刷方法和固相寡聚核苷酸合成法 的组合,可以产生这些阵列。参见Fodor等人,Science 251:767-777 (1991),Pirrung等人,美国专利号5,143,854(还可参见PCT申请号 WO 90/15070)和Fodor等人,PCT公开号WO 92/10092和美国专利号 5,424,186,所有教导在此引入作为参考。利用机械合成法合成这些阵 列的技术描述于,例如美国专利号5,384,261;所有教导在此引入作为 参考。在另一个实施例中,可以使用线性阵列。

一旦制备出寡聚核苷酸阵列,将感兴趣的核酸与阵列杂交,扫描 多态性。杂交和扫描通常的按照此处的方法以及描述于,例如,公开 的PCT申请号WO92/10092和WO95/11995,和美国专利号5,424,186 的方法进行,所有教导在此引入作为参考,总之,包括一种或者多种先 前鉴定的多态性标记物的靶核酸序列通过公知的扩增技术进行扩增, 例如,PCR。通常,这涉及引物序列的使用,所述引物序列从多态性上 下游与靶序列的两条链互补。也可以使用不对称PCR技术。扩增的靶, 通常包括标记,然后在合适条件下与阵列杂交。当阵列杂交完成和洗 涤后,扫描阵列以检测与靶序列杂交的阵列上的位置。扫描获得的杂 交数据通常是作为阵列上位置的函数的荧光强度形式。

尽管主要以单一检测块方式描述,例如,用于检测单个多态性, 阵列可以包括多重检测块,因此能够分析多个、特定特定多态性。另 一方面,通常应理解检测块可以组合到单一阵列内或者多个、独立的 阵列,这样在靶与阵列杂交期间,可以使用变化的、最优条件。例如, 通常需要提供检测与那些位于基因组序列A-T富集片段区的多态性分 开的那些位于基因组序列G-C延伸区内的多态性。这允许对各种情况 杂交条件的单独进行最优化。

寡聚核苷酸阵列用于多态性检测的其他应用可见于,例如,在美 国专利号5,858,659和5,837,832,全部教导在此引入作为参考。可以使 用其他的核酸分析方法检测II型糖尿病基因或者II型糖尿病基因编码 变异体中的多态性。典型的方法包括直接人工测序(Church和Gilbert, Proc.Natl.Acad.Sci USA 81:1991-1995(1988);Sanger,F.等人,Proc. Natl.Acad.Sci USA 74:5463-5467(1977);Beavis等人,美国专利号 5,288,644);自动荧光测序;单链构象多态性检测(SSCP);夹板变性 凝胶电泳(CDGE);变性梯度凝胶电泳(DGGE)(Sheffield,V.C.等 人,Proc.Natl Acad.Sci USA 86:232-236(1989)),迁移率分析(Orita,M. 等人,Proc.Natl Acad.Sci USA 86:2766-2770(1989)),限制性酶切分析 (Flavell等人,Cell 15:25(1978);Geever,等人,Proc.Natl.Acad.Sci USA 78:5081(1981));异质双链分析;化学错配切割(CMC)(Cotton 等人,Proc.Natl.Acad.Sci USA 85:4397-4401(1985));RNase保护试验 (Myers,R.M.等人,Science 230:1242(1985));识别核苷酸错配的多肽 的使用,例如E.coli mutS蛋白;例如等位基因-特定PCR。

在本发明的一个方面,II型糖尿病易感性或者II型糖尿病易感性 降低(或者指示抵抗II型糖尿病的保护性等位基因)的诊断,也可以 通过定量PCR(动态热循环)的表达分析实现。利用检测, 这项技术可以鉴定TCF7L2核酸编码的多肽或者TCF7L2核酸编码的剪 接变体的表达或者组成中改变的存在。探针还可用于鉴定多态 性以及患者是纯合子还是杂合体。此外,变异体表达可以量化为物理 不同或者功能不同的。

在本发明的另一个方面,II型糖尿病易感性或者II型糖尿病易感 性降低(或者指示抵抗II型糖尿病保护性等位基因)的诊断,可以通 过各种方法,包括酶联免疫吸附(ELISAs),Western印迹,免测沉淀 和免疫荧光法,检测TCF7L2多肽的表达和/或组成来实现。对个体待 测样品分析TCF7L2核酸编码的多肽的表达中改变和/或组成中改变的 存在,或者TCF7L2核酸编码的特定特定变异体的存在。在TCF7L2 核酸编码多肽表达中的改变可能是,例如,定量的多肽表达(即,产 生多肽的数量)的改变;TCF7L2核酸编码多肽的组成的改变是定性的 多肽表达(例如,改变的TCF7L2多肽或者不同剪接变体的表达)的改 变。在一个优选的方面,II型糖尿病易感性或者II型糖尿病易感性降 低的诊断,可以通过检测TCF7L2核酸编码的特定特定剪接变体或者剪 接变体的特定模式来实现。

这两种改变(定量的和定性的)均可以存在。此处使用的术语多 肽表达或者组成中的“改变”,是指待测样品中表达或者组成的改变, 与对照样品中TCF7L2核酸编码多肽的表达或者组成比较。对照样品是 与待测样品对应的样品(例如,来自相同种类的细胞),并且来自不 受II型糖尿病易感性影响的个体。与对照样品相比,待测样品中多肽 的表达或者组成的改变指示II型糖尿病的易感性。类似地,与对照样 品相比,待测样品中一种或多种不同剪接变体的存在,或者待测样品 中不同剪接变体显著地不同数量的存在指示II型糖尿病的易感性。可 以使用检测TCF7L2核酸编码多肽的表达或者组成的不同的方法,包 括:光谱法,比色法,电泳,等电点聚焦,和免疫测定(例如,David 等人,美国专利号4,376,110),例如免疫印迹(还可参见Current Protocols in Molecular Biology,尤其是第10章)。例如,一方面,可以使用能 够结合多肽的抗体(例如,如上所述),优选具有可检测标记的抗体。 抗体可以是多克隆的,或者更优选的,单克隆的。可以使用完整的抗 体,或者其片段(例如,Fab或者F(ab′)2)。术语“标记的”,就探针 或者抗体而言,意图是包括探针或者抗体的直接标记,通过将可检测 物质偶联(即,物理连接)到探针或者抗体,以及探针或者抗体的间 接标记,通过与直接标记的另一种试剂的反应。间接标记的实例包括 利用荧光标记的第二抗体和用生物素末端标记DNA探针检测第一抗 体,因此它可以利用荧光标记的链亲和素进行检测。

利用如上所述的与突变TCF7L2核酸编码的多肽特定结合的抗体, 或者与非突变核酸编码多肽特定结合的抗体,或者与核酸编码的特定 特定剪接变体特定结合的抗体的Western印迹分析,可用于鉴定待测样 品中特定剪接变体或者多态性的或者突变的TCF7L2核酸编码的多肽 的存在,或者待测样品中特定剪接变体或者非多态性的或者非突变的 核酸编码多肽的缺失。多态性的或者突变的核酸编码多肽的存在,或 者非多态性的或者非突变的核酸编码多肽的缺失,以及TCF7L2核酸编 码的特定剪接变体的存在(或者缺失),可用于诊断II型糖尿病的易 感性。

在这种方法的一方面,待测样品中TCF7L2核酸编码多肽的水平 或者数量与对照样品中TCF7L2编码多肽的水平或者数量进行比较。待 测样品中多肽的水平或者数量比对照样品中多肽的水平或者数量更高 或者更低,以致差异是统计上有显著意义的,提示TCF7L2核酸编码多 肽表达的改变,可用于诊断II型糖尿病的易感性。此外,待测样品中 TCF7L2核酸编码的多肽的组成与对照样品中TCF7L2核酸编码多肽的 组成进行比较(例如,不同剪接变体的存在)。与对照样品中多肽组 成比较,待测样品中多肽组成的差异可用于诊断II型糖尿病的易感性。 在另一方面,在待测样品和对照样品中均可检定多肽的水平或者数量 和组成。待测样品中多肽的数量或者水平相对对照样品的差异;待测 样品中组成相对对照样品的差异;或者数量或者水平的差异,和组成 的差异,指示II型糖尿病的易感性。

当与对照(疾病)样品比较时,相同方法可以相反地用于鉴定差 异的存在。与对照的差异指示糖尿病易感性的降低,和/或指示抵抗II 型糖尿病的保护性等位基因。

标记物和单倍型的评估

显示遗传多样性个体的种群具有不相同的基因组。此外,基因组 在基因组许多位置显示个体之间的序列变化;换言之,在种群中存在 许多多态性位点。在有些情况下,没有选择参考等位基因,对多态性 位点的不同等位基因做出参考。此外,参考序列可指特定定多态性位 点。有时参考等位基因是指“野生型”等位基因,它通常被选作第一 个测序的等位基因或者作为来自“未患病”个体的等位基因(例如, 不显示疾病或者异常表型的个体)。不同于参考的等位基因称为“变 异”等位基因。

本文所述的“标记物”是指表征为特定的变异等位基因(即多态 性位点)的基因组序列。标记物可以包括基因组内发现的任意变异类 型的任意等位基因,包括SNPs,微卫星,插入,缺失,重复和易位。

此处报道的SNP命名是指官方参考SNP(rs)ID识别标签,由国 家生物技术信息中心(NCBI)分配给每个独特的SNP。

本文所述的“单倍型”是指基因组DNA链的片段,其特征在于沿 片段排列的遗传标记物(“等位基因”)的特定组合。在某一实施方 式中,单倍型可以包括一种或者更多等位基因,两种或者更多等位基 因,三种或者更多等位基因,四种或者更多等位基因,或者五种或者 更多等位基因。遗传标记物是在与TCF7L2外显子4LD块相关“多态 性位点”的特定特定“等位基因”。本文使用的“TCF7L2外显子4LD 块”是指Chr10q上的LD块,其中观察到变异与II型糖尿病的相关性。 该LD块的NCBI Build 34位置是114,413,084-114,488,013bp。本文所 述的术语“易感性”包括增加的易感性和降低的易感性。因此,本发 明的特定特定标记物和/或单倍型可以表征为II型糖尿病易感性的增 加,其特征是相对危险度大于1。造成II型糖尿病易感性增加的标记物 和/或单倍型还可以被认为是“具有风险”,因为它们显示疾病风险的 增加。此外,本发明的标记物和/或单倍型可以表征为II型糖尿病易感 性的降低,其特征是相对危险度小于1。

种群(或者自然群体或者合成群体,例如,合成分子文库)中其 位置上可能具有超过一个序列的核苷酸位置在本文中被称为“多态性 位点”。当多态性位点长度是单核苷酸时,该位点称为单核苷酸多态 性(SNP)。例如,如果在特定特定染色体位置,群体的一个成员具有 腺嘌呤而该群体的另一个成员在相同位置具有胸腺嘧啶,则这个位置 是多态性位点,和更具体地,该多态性位点是SNP。当它们位于SNP 检测中的多态性位点时,本文所述的SNP标记物的等位基因是指碱基 A、C、G或者T。本领域技术人员明白通过检测或者阅读相反链,各 种情况下都可以检测互补等位基因。因此,对包括A/G多态性的多态 性位点,采用的检测可以测定两个可能碱基的百分比或者比例,即A 和G。此外,通过设计测定DNA模板上相反链的检测法,可以测定互 补碱基T/C的百分比或者比例。定量的(例如,按照相对危险度)相 同结果将从任意DNA链(+链或者-链)的检测获得。多态性位点允许 基于取代、插入或者缺失的序列差异。例如,多态性微卫星在特定定 位点具有多个小碱基重复(例如CA重复),其中普通群体中重复长度 的数目不同。本文中与多态性位点有关的各种形式的序列被称为多态 性位点的“等位基因”。因此,在早先的实例中,SNP包括了腺嘌呤 等位基因和胸腺嘧啶等位基因。发现的位于TCF7L2外显子4LD块内, 与II型糖尿病相关的SNPs和微卫星标记物描述于表2-7。

通常,参考序列是指特定序列。不同于参考的等位基因称为“变 异”等位基因。例如,NCBI Build 34位置114413084和114488013之 间(等于74929bp,或者74.9kb)的参考基因组DNA序列,这是指染 色体10内的位置,本文中描述为SEQ ID NO:1。本文使用的变异序列, 是指不同于SEQ ID NO:1的序列,但基本上是相似的。组成与TCF7L2 外显子4LD块相关单倍型的遗传标记物是变异体。其他变异体可以包 括影响多肽例如TCF7L2基因编码多肽的变化。当与参考核苷酸序列比 较时,这些序列差异可以包括单个核苷酸或者不止一个核苷酸的插入 或者缺失。这种序列差异可以导致移码;至少一个核苷酸的改变,导 致编码氨基酸的改变;至少一个核苷酸的改变,导致终止密码子的提 前产生;几个核苷酸的缺失,可以导致一个或者多个核苷酸编码氨基 酸的缺失;一个或者几个核苷酸的插入,例如通过不等重组或者基因 转换,可以导致读码框编码序列的中断;全部或者部分序列的复制; 转座;或者核苷酸序列的重排,如本文详细所述。这种序列变化改变 核酸编码的多肽。例如,如果核酸序列的变化造成移码,移码可能导 致编码氨基酸的改变,和/或可能导致提前终止密码子的产生,产生截 短多肽。此外,II型糖尿病相关多态性或者II型糖尿病易感性可能是 一种或者多种核苷酸的同义变化(即,不导致氨基酸序列改变的变化)。 这类多态性可能,例如,改变剪接位点,影响mRNA的稳定性或者转 运,或者影响编码多肽的转录或者翻译。它还可能改变DNA来增加结 构变化的可能性,例如在肿瘤的体细胞水平发生的扩增或者缺失。参 考核苷酸序列编码的多肽是具有特定特定参考氨基酸序列的“参考” 多肽,变异等位基因编码的多肽是指具有变异氨基酸序列的“变异” 多肽。

多态性微卫星在特定特定位点具有长度在2-8个核苷酸(例如CA 重复)的多个小的碱基重复,,其中普通群体中重复长度的数目不同。 Indel是一种常见的多态性形式,包括小的插入或者缺失,通常只有几 个核苷酸长度。

本文描述的单倍型是在多态性位点具有特定等位基因的不同遗传 标记物的组合,例如SNPs和微卫星。单倍型可能包括不同遗传标记物 的组合,因此,可以通过本领域已知的检测多态性位点序列的方法检 测单倍型。例如,可以使用检测SNPs和/或微卫星标记物存在的基因 分型标准技术,例如基于荧光的技术(Chen,X.等人,Genome Res.9(5): 492-98(1999)),PCR,LCR,巢式PCR和用于核酸扩增的其他技术。 可以在风险单倍型中鉴定到这些标记物和SNPs。鉴定相关标记物和 SNPs的一些方法包括使用连锁不平衡(LD)和/或LOD值。

在本文描述的一些方法中,具有患II型糖尿病风险的个体是鉴定 出风险标记物或者单倍型的个体。在一方面,风险标记物或者单倍型 是指造成II型糖尿病风险(或者易感性)显著增加的标记物或者单倍 型。在一个实施方式中,通过相对危险度测定标记物或者单倍型相关 的显著度。在另一个实施方式中,显著度利用百分比测定。在一个实 施方式中,显著增加的风险测定为相对危险度至少是约1.2,包括但不 限于:1.2,1.3,1.4,1.5,1.6,1.7,1.8和1.9。在另一个实施方式中, 至少为1.2的相对危险度是显著的。在另一个实施方式中,至少为大约 1.5的相对危险度是显著的。在另一个实施方式中,风险显著增加到至 少大约1.7是显著的。在另一个实施方式中,风险显著增加至少大约 20%,包括但不限于大约25%,30%,35%,40%,45%,50%,55%, 60%,65%,70%,75%,80%,85%,90%,95%和98%。在另一个实 施方式中,风险显著增加至少大约50%。

在本发明的其他实施方式中,标记物或者单倍型造成II型糖尿病 风险的降低(易感性降低)。在一个实施方式中,显著降低的风险测 定为相对危险度小于0.9,包括但不限于0.9,0.8,0.7,0.6,0.5和0.4。 在另一个实施方式中,显著的相对危险度小于0.7。在另一个实施方式 中,风险(或者易感性)降低至少大约20%,包括但不限于大约25%, 30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%, 85%,90%,95%和98%。在另一个实施方式中,风险显著下降至少大 约30%。

因此,术语“II型糖尿病易感性”表示II型糖尿病增加的风险或 者易感性或者降低的风险或者易感性,当某一等位基因、标记物、SNP 或者单倍型存在时,数量是显著的;显著度按上述方法测定。本文使 用的术语“降低的风险”、“降低的易感性”和“保护”表示当某一 其他等位基因、标记物、SNP和/或某一其他单倍型存在时,相对危险 度相应降低。但是应了解,鉴定增减的风险是否是医学显著的还依赖 于各种因素,包括特定疾病,标记物或者单倍型,并且通常还包括环 境因素。

TCF7L2基因内或者包括部分TCF7L2基因的风险标记物或者单倍 型,是相对于健康个体(对照)中存在的频率,在具有患II型糖尿病 风险个体(患病的)中存在频率更高的标记物或者单倍型,其中标记 物或者单倍型的存在指示II型糖尿病易感性。简单相关检验的一个实 例是对2×2表进行的Fisher精确检验。从大量染色体中构建染色体群 组的2×2表,所述染色体可以包括标记物或者单倍型两者,只包括标 记物或者单倍型中的一个而不包括另一个,和标记物或者单倍型都不 包括。

在本发明的某些方面,风险标记物或者单倍型是与II型糖尿病显 著相关的TCF7L2内或者邻近TCF7L2的风险标记物或者单倍型。在其 他方面,风险标记物或者单倍型包括TCF7L2内或者邻近TCF7L2的风 险标记物或者单倍型,TCF7L2与II型糖尿病易感性显著相关。在本发 明的特定实施方式中,如本文描述,标记物或者单倍型与TCF7L2外显 子4LD块相关。

可以使用检测SNPs和/或微卫星标记物存在的基因分型标准技术, 例如基于荧光的技术(Chen,等人,Genome Res.9,492(1999)),PCR, LCR,巢式PCR和用于核酸扩增的其他技术。在优选的方面,该方法 包括检定个体中SNPs和/或微卫星的存在或者频率,所述SNPs和/或 微卫星在TCF7L2基因内或者包括部分TCF7L2基因,其中SNPs和/ 或微卫星相对健康对照个体的过度或者更高频率指示个体是II型糖尿 病易感的。这种SNPs和标记物可以用作筛选工具的单倍型。可以在风 险单倍型中鉴定这些标记物和SNPs。例如,风险单倍型可以包括微卫 星标记物和/或SNPs,例如标记物DG10S478和/或SNP rs12255372, rs7895340,rs11196205,rs7901695,rs7903146,rs12243326或者 rs4506565。风险单倍型的存在指示II型糖尿病易感性的增加,从而提 示个体属于本文所述治疗方法的目标人群。

易感性变异体的鉴定

利用期望最大化算法可以估计患者组和对照组中单倍型的频率 (Dempster A.等人,J.R.Stat.Soc.B,39:1-38(1977))。可以使用能够 处理缺失基因型和相不确定性的这种实现算法。在零假设下,患者和 对照被认为具有相同频率。利用相似方法,检验另一种假设,其中可 能包括本文所述标记物的候选风险单倍型在患者中具有比对照更高的 频率,而这两组中其他单倍型频率的比例被认为是相同的。在这两个 假设下相似性分别被最大化,对应1-df似然比统计值被用于评定统计 显著性。

为了寻找连锁区域内的风险和保护性标记物和单倍型,例如,研 究基因分型的标记物所有可能组合的相关性,假设这些标记物跨越实 际区域。组合的患者和对照组可随机分成两组,与原始患者和对照组 规模相同。然后重复标记物和单倍型分析,确定记录的最显著的p-值。 可以重复这种随机化方案,例如,超过100次以构建p-值的经验分布。 在一个优选的实施方式中,<0.05的p-值提示显著的标记物和/或单倍型 关联。

下面详细讨论单倍型分析。

单倍型分析

单倍型分析的一种常用方法涉及利用NEsted MOdels的似然推断 (Gretarsdottir S.,等人,Nat.Genet.35:131-38(2003))。在程序NEMO 中进行该方法,适合多种多态性标记物、SNPs和微卫星。方法和软件 是特意设计用于病例对照研究,其目的是鉴定造成不同风险的单倍型 组。它还是研究LD结构的工具。在NEMO中,借助EM算法,对将 其作为缺失-数据问题的观测数据,直接计算最大似然估计值、似然比 和p-值。

检测信息

即使对观测数据直接计算基于相似性的似然比检验可以被信赖得 出正确的p-值,所述观测数据已捕获因为相不确定性和缺失基因型导 致的信息丢失,但仍有兴趣了解因为信息不完整导致多少信息丢失。 单倍型分析的信息测量法描述于Nicolae和Kong(Technical Report 537, Department of Statistics,University of Statistics,University of Chicago; Biometrics,60(2):368-75(2004)),作为设定用于连锁分析的信息测量 法的自然延伸,在NEMO中应用。

统计分析

对单一标记物与疾病的关联,Fisher精确检验可用于计算各个个 体等位基因的双边p-值。全部p-值表现为未校正的,用于多重比较, 除非特别标出。显示的频率(对微卫星,SNPs和单倍型)是与载体频 率相对的等位基因的频率。为了最小化患者亲缘性造成的任何偏差, 所述患者作为家族被征集用于连锁分析,一级和二级亲属可以从患者 列表中除去。此外,可以重复检验以通过延长差异调整过程而进行患 者中任意剩余亲缘性的关联修正,该过程描述于Risch,N.& Teng,J. (Genome Res.,8:1273-1288(1998)))),和对血缘关系进行DNA收集合 并(pooling)(ibid),这样它可以被用于普通家族关系,提供校正和 未校正的p-值用于比较。与预期一致,差异通常非常小。为了评定多 重检验修正的单一标记物关联的显著度,我们可以利用相同基因型数 据进行随机性检验。患者和对照的群组可以随机分配,多次重复关联 分析(例如,直到500,000次),p-值是重复检验的分数,所述重复检 验得到一些标记等位基因的p-值小于或者等于利用原始患者和对照群 组观察到的p-值。

对单一标记物和单倍型分析,相对危险度(RR)和群体归因危险 度(PAR)可以利用乘法模型(单倍型相对危险度模型)计算(Terwilliger, J.D.& Ott,J,Hum.Hered.42:337-46(1992)和FaIk,CT.& Rubinstein,P, Ann.Hum.Genet.51(Pt 5j:227-33(1987))),即,人携带两个等位基因/ 单倍型的风险倍增。例如,如果RR是A相对于a的风险,则纯合子 AA的风险是杂合子Aa风险的RR倍,是纯合子aa风险的RR2倍。乘 法模型具有良好特性,可以简化分析和计算-单倍型是独立的,即在 患病群体以及对照群体内Hardy-Weinberg平衡。因此,患病的和对照 的单倍型计数均具有多项分布,但在另外假设下具有不同的单倍型频 率。具体地,对两个单倍型hi和hj,风险(hi)/风险(hj)=风险(fi/pi) /风险(fj/pj),其中f和p分别表示在患病群体和对照群体中的频率。 如果真实模型不是倍增的,会存在一些功能损失,除极端情况外损失 倾向于适度的。最重要地,p值总是有效的,因为它们根据零假设计算。

利用NEMO的连锁不平衡

利用D′和R2的标准定义可以计算标记物对之间的LD(Lewontin, R.,Genetics 49:49-67(1964);Hill,W.G. & Robertson,A.Theor.Appl. Genet.22:226-231(1968))。利用NEMO,通过最大似然法估算两个标 记等位基因组合的频率,通过似然比检验计算连锁平衡的偏差。采用 边缘等位基因可能性加权,通过计算两个标记物所有可能等位基因组 合的平均值,将D′和R2的定义延伸至包括微卫星。当描绘出全部标记 物组合以说明特定区域中的LD结构,我们将D′绘制在左上角,p-值绘 制在右下角。如果需要,在LD图中标记物可以绘制成等距离的而不是 根据它们的物理位置。

连锁分析的统计方法

多点、只在患者中有的等位基因-共用方法(Multipoint, affected-only allele-sharing methods)可用于分析来评定连锁证据。结果, LOD值和非参数的连锁(NPL)值,可以利用程序Allegro获得 (Gudbjartsson等人,Nat.Genet.25:12-3(2000))。我们的基线连锁分 析利用Spairs评分函数(Whittemore,A.S.,Halpern,J.Biometrics 50: 118-27(1994);Kruglyak L.等人,Am.J.Hum.Genet 55:1347-63(1996)), 指数等位基因-共用模式(Kong,A.和Cox,NJ.,Am.J.Hum.Genet. 61:1179-88(1997))和家族权重计算方法,所述权重计算方法是在log 级别,处于相同地加权各患病对和相同地加权各家族之间中途。我们 使用的信息测量是Allegro程序输出值的一部分,如果标记物基因型是 完全不提供信息的,则信息值等于零,如果在患病的亲属间基因型测 定了精确数量的共享等位基因,则信息值等于一(Gretarsdottir等人, Am.J.Hum.Genet.,70:593-603(2002))。用两种不同方法计算p-值, 这里报道的是较不显著的结果。第一个p-值可以根据大样本理论计算; 在无连锁的零假设下Z1r=□(2[loge(10)LOD])的分布大约是标准正 态变量(Kong,A.和Cox,N.J.,Am.J.Hum.Genet.61:1179-88 (1997))。通过观察到的LOD值与其在零假设下完整数据取样分布的 比较,可以计算第二个p值(例如,Gudbjartsson等人,Nat.Genet. 25:12-3(2000))。当数据由好几个家族组成时,这两个p值倾向于非 常相似。

易感性基因座的单倍型和“单倍型块”定义

在一些实施方式中,标记物和单倍型分析涉及定义基于“单倍型 块”的候选易感性基因座(也称为“LD块”)。已经有报道,部分人 基因组可以分解成包含一些常见单倍型的系列离散的单倍型块;对于 这些块,连锁不平衡数据几乎没有提供数据表明重组(参见,例如, Wall,J.D.和Pritchard,J.K.,Nature Reviews Genetics 4:587-597(2003); Daly,M.等人,Nature Genet.29:229-232(2001);Gabriel,S.B.等人, Science 296:2225-2229(2002);Patil,N.等人.,Science 294:1719-1723 (2001);Dawson,E.等人,Nature 418:544-548(2002);Phillips,M.S.等人, Nature Genet.35:382-387(2003))。

主要有两种定义这些单倍型块的方法:块可以定义为具有有限单 倍型多样性的DNA区域(参见,例如,Daly,M.等人,Nature Genet. 29:229-232(2001);Patil,N.等人,Science 294:1719-1723(2001);Dawson, E.等人,Nature 418:544-54%(2002);Zhang,K.等人,Proc.Natl.Acad. Sci.USA 99:7335-7339(2002)),或者是利用连锁不平衡鉴定的在过渡 带之间具有广泛历史重组的区域(参见,例如,Gabriel,S.B.等人, Science 296:2225-2229(2002);Phillips,M.S.等人,Nature Genet. 33:382-387(2003);Wang,N.等人,Am.J.Hum.Genet.77:1227-1234 (2002);Stumpf,M.P.,和Goldstein,D.B.,Curr.Biol.73:1-8(2003))。本 文使用的术语“单倍型块”或者“LD块”包括任意一种特征定义的块。

单倍型块鉴定的典型方法公开于,例如,美国公开的专利申请号 20030099964,20030170665,20040023237和20040146870。单倍型块 可以方便的用于对表型和单倍型情况之间的关联性作图。在各单倍型 块中可以鉴定主要单倍型,然后可以鉴定出一组“标签”SNPs或者标 记物(需要最小组的SNPs或者标记物以区别单倍型)。然后这些标签 SNPs或者标记物可用于鉴定来自各组个体的样品,以便鉴定表型和单 倍型之间的关联性。如果需要,相邻单倍型块可以同时评定,因为单 倍型块间可能存在连锁不平衡。

单倍型和诊断

如本文所述,包括这种标记物的一些标记物和单倍型被发现可用 于II型糖尿病易感性的测定-即发现它们可用于II型糖尿病易感性的 诊断。发现特定标记物和单倍型在患有II型糖尿病的个体中的频率比 没有II型糖尿病的个体中的频率更高。因此,这些标记物和单倍型具 有在个体中检测II型糖尿病或者II型糖尿病易感性的预测价值。发现 包括一些标签标记物的单倍型块(即TCF7L2外显子4LD块)在患有 II型糖尿病的个体中的频率比在没有II型糖尿病的个体中的频率更高。 因此,这些单倍型块内的“风险”标签标记物也具有在个体中检测II 型糖尿病或者II型糖尿病易感性的预测价值。单倍型或者LD块内的 “风险”标签标记物还可以包括区分单倍型的其他标记物,因为这些 标记物类似的具有检测II型糖尿病或者II型糖尿病易感性的预测价值。 作为人类基因组单倍型块结构的结果,与单倍型块(LD块)相关的大 量标记物或者其他变异体和/或包括这种标记物或者变异体的单倍型可 以被认为与某一特征和/或表型相关。因此,位于本文定义的TCF7L2 外显子4LD块内或者与TCF7L2外显子4LD块具有强LD(特征为r2大于0.2)的标记物和/或单倍型可能与II型糖尿病相关(即它们造成 增加或减少的II型糖尿病易感性)。这包括本文描述的标记物(表6), 但还可能包括与表6所列的一个或者多个标记物具有强LD(特征为r2大于0.2)的其他标记物。可以通过本领域技术人员公知的方法鉴定这 类其他变异体,例如通过对特定个体组LD块A基因组区域进行DNA 测序,本发明也包括这类其他变异体。

如本文所述,发现TCF7L2外显子4LD块内的一些标记物的频率 在患有II型糖尿病的个体中降低,包括两种或更多表13、20和21所 列的那些标记物的单倍型也被发现在患有II型糖尿病的个体中频率降 低。因此这些标记物和单倍型对II型糖尿病是保护性的,即它们造成 携带这些标记物和/或单倍型的个体患II型糖尿病的风险降低。

本文描述的单倍型和标记物,在一些情况下,是不同遗传标记物 的组合,例如,SNPs和微卫星。因此,可以通过本领域已知的和/或本 文所述的检测多态性位点序列的方法检测单倍型。此外,利用标准技 术可以验证某些单倍型或者标记物组和疾病表型之间的相关性。简单 的相关性检验的一个典型实例是对2×2表进行Fisher精确检验。

在特定实施方式中,与TCF7L2外显子4LD块相关的标记物或者 单倍型,是相对于其在健康个体(对照)中存在的频率,在具有患II 型糖尿病风险个体(患病的)中存在频率更高的标记物或者单倍型, 其中标记物或者单倍型的存在指示II型糖尿病或者II型糖尿病易感性。 在其他实施方式中,与TCF7L2外显子4LD块相关的一个或者多个标 记物具有连锁不平衡的风险标签标记物,是相对于健康个体(对照) 中存在的频率,在具有患II型糖尿病风险个体(患病的)中存在频率 更高的标签标记物,其中标签标记物的存在指示II型糖尿病增加的易 感性。在其他实施方式中,与TCF7L2外显子4LD块相关的一个或者 多个标记物具有连锁不平衡的风险标签标记物,是相对于健康个体(对 照)中存在的频率,在具有患II型糖尿病风险个体中存在频率更高的 标记物,其中标记物的存在指示II型糖尿病易感性。

在本文描述的一些方法中,具有患II型糖尿病风险的个体是鉴定 出风险标记物或者单倍型的个体。在一个实施方式中,标记物或者单 倍型关联性的强度采用相对危险度(RR)来测定。RR是携带标记物或 者单倍型的一个拷贝个体的发病率相对不携带标记物或者单倍型个体 的发病率的比例。这个比例相当于携带两个拷贝标记物或者单倍型个 体的发病率相对携带一个拷贝标记物或者单倍型个体的发病率的比 例。在一个实施方式中,标记物或者单倍型具有至少为1.2相对危险度。 在其他实施方式中,标记物或者单倍型具有至少1.3,至少1.4,至少 1.5,至少2.0,至少2.5,至少3.0,至少3.5,至少4.0,或者至少5.0 的相对危险度。

在本发明的其他方法中,患II型糖尿病风险降低(或者易感性降 低)的个体是鉴定出保护性标记物或者单倍型的个体。在这种情况下, 相对危险度(RR)小于1。在一个实施方式中,标记物或者单倍型具 有小于0.9的相对危险度。在另一个实施方式中,标记物或者单倍型具 有的相对危险度小于0.8,小于0.7,小于0.6,小于0.5或者小于0.4。

遗传检验的实用性

与造成发展II型糖尿病风险的遗传变异有关的知识,为能够区分 患病风险增加个体(即风险变异体携带者)和患病风险降低个体(即 保护性变异体的携带者)的遗传-检验提供了可能。对属于上述两组的 个体进行遗传检验的核心价值,是在早期诊断疾病的可能性,以及给 临床医生提供关于疾病预后/侵袭性信息,以便能够采用最合适的治疗 方法。例如,II型糖尿病遗传检验的应用使在早期检测疾病成为可能, 这导致在早期就可以进行治疗检查,从而可以最小化疾病的有害作用 和II型糖尿病造成的严重健康后果。

治疗方法

在本发明的另一个实施方式中,该方法可用于治疗II型糖尿病。 本文使用的术语“治疗”不仅指改善II型糖尿病相关症状,而且还指 预防或者延缓II型糖尿病的发病;减轻II型糖尿病症状的严重程度或 者频率;和/或减轻与其他药物联合治疗的必要性,所述其他药物用来 改善II型糖尿病的相关症状。一方面,待接受治疗的个体是II型糖尿 病易感的(增加风险)的个体(例如,具有以下等位基因存在的个体: 标记物DG10S478除了0等位基因以外其他等位基因的存在;SNP rs12255372的T等位基因的存在;SNP rs7895340的A等位基因的存在; SNP rs11196205的C等位基因的存在;SNP rs7901695的C等位基因的 存在;SNP rs7903146的T等位基因的存在;SNP rs12243326的C等位 基因的存在;或者SNP rs4506565的T等位基因的存在)。

在本发明的其他实施方式中,该方法可用于治疗其他TCF7L2相 关的疾病或者病症。TCF7L2治疗剂可以用于II型糖尿病的治疗方法, 以及其他TCF7L2相关疾病或者病症的治疗方法。

治疗方法(预防和/或治疗的)使用TCF7L2治疗剂。“TCF7L2 治疗剂”是一种直接地或者间接改变(例如,增强或者抑制)TCF7L2 的多肽活性和/或核酸表达(例如,通过改变与TCF7L2相互作用蛋白 的活性或者核酸表达,例如Wnt信号途径或者钙粘蛋白途径中的蛋白 (例如,beta-连环蛋白))的药剂。在某些实施方式中,TCF7L2治疗 剂改变TCF7L2的活性和/或核酸表达。

TCF7L2治疗剂可以通过各种方法改变TCF7L2多肽活性或者核酸 表达,例如,通过提供额外TCF7L2多肽或者通过上调TCF7L2核酸的 转录或者翻译;通过改变TCF7L2多肽的翻译后加工;通过改变TCF7L2 剪接变异体的转录;或者通过干扰TCF7L2多肽活性(例如,通过结合 TCF7L2多肽),或者通过结合与TCF7L2相互作用的另一个多肽,通 过改变TCF7L2核酸的(例如,下调)表达、转录或者翻译,或者通过 改变(例如,激动或者拮抗)活性。

典型的TCF7L2治疗剂包括下列物质:本文描述的核酸或者其片 段或者其衍生物,特别是编码本文描述多肽的核苷酸和包括这类核酸 的载体(例如,基因,cDNA,和/或mRNA,例如编码TCF7L2多肽或 者活性片段或者其衍生物的核酸,或者寡聚核苷酸;或者其互补物, 或者片段或者其衍生物,和/或II型糖尿病核酸或者片段或者其衍生物 编码的其他剪接变异体);本文描述的多肽和/或TCF7L2核酸或者片 段或者其衍生物编码的剪接变异体;其他多肽(例如,TCF7L2受体); TCF7L2结合剂;或者影响(例如,增加或者降低)活性的药剂,抗体, 例如抗突变TCF7L2多肽的抗体,或者抗非突变TCF7L2多肽的抗体, 或者抗上述TCF7L2核酸编码的特定剪接变异体的抗体;模拟肽;融合 蛋白或者其前体药物;核酶;其他小分子;和其他改变(例如,增强 或者抑制)TCF7L2核酸表达的药剂,或者调节TCF7L2剪接变异体转 录的药剂(例如,影响那个剪接变异体表达,或者影响各剪接变异体 表达数量的药剂)。其他典型的TCF7L2治疗剂包括影响胰岛素信号和 /或胰高血糖素,GLP-1或者GIP信号的化合物。如果需要,可以同时 使用不止一种TCF7L2治疗剂。

在优选的实施方式中,TCF7L2治疗剂是干扰TCF7L2活性的药剂, 例如,干扰TCF7L2结合或者TCF7L2与beta-连环蛋白或其他蛋白相 互作用的药剂(参见,例如,Fasolini,等人,J.Biol.Chem 278(23):21092-06(2003))。其他TCF7L2治疗剂包括影响Wnt信号途 径的药剂或者影响钙粘蛋白途径的药剂。典型药剂包括例如那些用于 癌症治疗的药剂,包括,例如,蛋白例如DKK蛋白;APC的beta-连 环蛋白结合结构域或者Axin;因子例如IDAX,AXAM和ICAT;反义 寡聚核苷酸或者干扰RNA(RNAi),例如伴随Vitravene的使用;溶 瘤细胞病毒载体;和其他化合物(参见,例如,Luu等人,Current Cancer Drug Targets 4:6530671(2004));小分子拮抗剂,包括,例如,ZTM00990, PKF118-310,PKF118-744,PKF115-584,PKF222-815,CGPO49090, NPDDG39.024和NPDDG1.024,如Lepourcelet等人所述(参见,例如, Lepourcelet等人,Cancer Cell 5:91-102(2004));美国专利6,762,185中 描述的化合物;美国专利申请20040005313,20040072831,20040247593, 或者20050059628中描述的化合物。其他典型的TCF7L2治疗剂包括 gsk3抑制剂,包括,例如,在美国专利6,057,117;6,153,618;6,417,185; 6,465,231;6,489,344;6,512,102;6,608,063;6,716,624;6,800,632; 和公开的美国专利申请20030008866;20030077798;20030130289; 20030207883;2000092535;和200500851中描述的那些gsk3抑制剂。 说明书中引用的所有参考文献、专利和专利申请的全部教导在此完整 引入。

其他典型的TCF7L2治疗剂如下面药剂表所示。

药剂表

  化合物名称   化合物名称(利用来自MDL信   息系统的Autonom,ISIS Draw   version 2.5产生)   公司   化合物参考文献   适应症

  AR-0133418(S   N-4521)   1-(4-甲氧苯甲基)-3-(5-硝基噻唑   -2-基)-尿素   AstraZeneca   AD   AR-025028   NSD   AstraZeneca   CT-98023   N-[4-(2,4-二氯苯基)-5-(1H-咪唑   -2-基)-嘧啶-2-基]-N’-(5-硝基-吡   啶-2-基)-乙烷-1,2-二胺   Chrion Corp   非胰岛素依赖   性糖尿病   CT-20026   NSD   Chrion Corp   Wagman等人,Curr   Pharm.Des   2004:10(10)1105-37   非胰岛素依赖   性糖尿病   CT-21022   NSD   Chrion Corp   非胰岛素依赖   性糖尿病   CT-20014   NSD   Chrion Corp   非胰岛素依赖   性糖尿病   CT-21018   NSD   Chrion Corp   非胰岛素依赖   性糖尿病   CHIR-98025   NSD   Chrion Corp   非胰岛素依赖   性糖尿病   CHIR-99021   NSD   Chrion Corp   Wagman等人,Curr   Pharm.Des   2004:10(10)1105-37   非胰岛素依赖   性糖尿病   CG-100179   NSD   CrystalGenomi   cs和Yuyu   WO-2004065370   糖尿病(韩国)   4-[2-(4-二甲氨基-3-硝基-苯基氨   基)-嘧啶-4-基]-3,5-二甲基-1H-   吡咯-2-腈   Cyclacel Ltd.   非胰岛素依赖   性糖尿病,等等   NP-01139,   NP-031112,   NP03112,   NP-00361   4-苄基-2-甲基   -[1,2,4]thiadiazolidine-3,5-二酮   Neuropharma   SA   中枢神经系统   障碍,AD   3-[9-氟-2-(哌啶-1-羰基)-1,2,3,4-   四氢-[1,4]diazepino[6,7,1-hi]吲   哚-7-基]-4-咪唑[1,2-a]吡啶-3基-   吡咯-2,5-二酮   EliLilly & Co   非胰岛素依赖   性糖尿病   GW-784725x,   GW-784775,   SB-216763,   SB-415286   环戊烷羧酸(6-吡啶-3-基   -furo[2,3-d]嘧啶-4-基)-酰胺   GSK   WO-03034447(参考   的化合物:4-[2-(2-   溴苯基)-4(4-氟苯   基)-1H-咪唑-5-基]   吡啶   非胰岛素依赖   性糖尿病,神   经退行性疾病

NNC-57-0511, NNC-57-0545, NNC-57-0588 1-(4-氨基-呋咱-3-基)-5-哌啶-1- 基甲基-1H-[1,2,3]三唑-4-羧酸 [1-吡啶-4-基-甲基-(E)-yldene]- 酰肼 Novo Nordisk 非胰岛素依赖 性糖尿病 CP-70949 NSD Pfizer 降血糖药 VX-608 NSD 脑血管局部缺 血,非胰岛索 依赖性糖尿病 KP-403类型 NSD Kinetek 核因子kappaB 调节剂,消炎, 细胞循环抑制 剂,糖原合酶激酶-3beta抑制剂BYETTAO Exenatide:C184H282N50O60S-氨 基酸序列:H-His-Gly-Glu- Gly-Thr-Phe-Thr-Phe-Thr-Ser- Asp-Leu-Ser-Lys-Gln-Met-Glu- Glu-Glu-Ala-Val-Arg-Leu-Phe- Ile-Glu-Trp-Leu-Lys-Asn-Gly- Gly-Pro-Ser-Ser-Gly-Ala-Pro- Pro-Pro-Ser-NH2Amylin/Eli Lilly & Co 非胰岛素依赖 性糖尿病 Vildagliptin (LAF237) NSD Novartis 非胰岛素依赖 性糖尿病- DPP-4抑制剂

NSD=结构未公开(在Iddb3中)

以治疗有效量(即,如上述足以“治疗”的数量)的TCF7L2治 疗剂给药。对特定个体病症或者疾病治疗有效的剂量依赖于疾病的症 状和严重程度,这可以通过标准临床技术来确定。此外,可以选择体 外或者体内检测帮助确定最适剂量范围。剂型中使用的精确剂量还依 赖于给药途径和疾病或者病症的严重性,这应该根据医师的判断和各 个患者的情况来决定。可以从来白体外或者动物模型检测系统的剂量 反应曲线推断出有效剂量。

在一个实施方式中,可以使用核酸(例如,编码TCF7L2多肽的 核酸);或者编码TCF7L2多肽或者剪接变异体、衍生物或者其片段的 其他核酸,单独的或者在如上所述的药物组合物中。例如,编码TCF7L2 多肽的TCF7L2基因或者核酸或者cDNA,独立的或包括在载体内,可 以被导入细胞(体外或体内),这样细胞产生天然的TCF7L2多肽。必 要时,已经转化了基因或者cDNA或者包括基因、核酸或者cDNA的 载体的细胞可以被导入(或者再导入)患有疾病的个体。因此,本身 缺乏天然TCF7L2表达和活性,或者具有突变的TCF7L2表达和活性, 或者具有疾病相关TCF7L2剪接变异体表达的细胞,可以被工程化表达 TCF7L2多肽或者TCF7L2多肽的活性片段(或者TCF7L2多肽的不同 变异体)。在某些实施方式中,编码TCF7L2多肽或者活性片段或者其 衍生物的核酸,可以被导入表达载体,例如病毒载体,然后载体可以 导入动物的合适细胞中。可以使用其他基因转移系统,包括病毒和非 病毒转移系统。此外,还可以使用非病毒基因转移方法,例如磷酸钙 共沉淀,机械技术(例如,微量注射);经由脂质体膜融合介导的转 移;或者直接DNA吸收。

此外,在本发明的另一个实施方式中,本发明的核酸;与本发明 核酸互补的核酸;或者这类核酸的一部分(例如,如下所述的寡聚核 苷酸),可用于“反义”治疗,其中在原位给药或者产生与II型糖尿 病基因的mRNA和/或基因组DNA特异杂交的核酸(例如,寡聚核苷 酸)。与mRNA和/或DNA特异杂交的反义核酸抑制TCF7L2多肽的 表达,例如,通过抑制翻译和/或转录。反义核酸的结合可以通过常规 碱基对互补,或者,例如,就结合DNA双链而言,通过在双螺旋大沟 内的特异相互作用。

本发明的反义构建体可以例如作为上述表达质粒被输送。当质粒 在细胞中转录时,产生与编码TCF7L2多肽的mRNA和/或DNA的部 分片段互补的RNA。此外,反义构建体可以是离体产生并被导入细胞 的寡聚核苷酸探针;然后它通过与多肽的mRNA和/或基因组DNA的 杂交抑制表达。在一个实施方式中,寡聚核苷酸探针是修饰的寡聚核 苷酸,能够抵抗内源核酸酶,例如核酸外切酶和/或核酸内切酶,因此 它们在体内是稳定的。用作反义寡聚核苷酸的示例性核酸分子是DNA 的氨基磷酸酯,硫代磷酸酯和甲基膦酸酯类似物(还可参见美国专利 号5,176,996;5,264,564;和5,256,775)。此外,用于反义治疗的寡聚 物的常见构建方法还描述于,例如,Van der Krol等人,(BioTechniques 6:958-976(1988));和Stein等人,(Cancer Res.48:2659-2668(1988))。 就反义DNA而言,来自翻译起始位点的寡聚脱氧核糖核苷酸是优选的。

为进行反义治疗,设计与编码TCF7L2基因的mRNA互补的寡聚 核苷酸(mRNA,cDNA或者DNA)。反义寡聚核苷酸与TCF7L2mRNA 转录产物结合,并阻止翻译。完全互补,虽然是优选的,但不是必须 的。本文所指的与RNA部分“互补”的序列,表示序列具有足够的互 补性能够与RNA杂交形成稳定的双链;就双链反义核酸来说,因此可 以检测双链DNA的单链,或者也可以检测三链形成。杂交能力取决于 互补程度和反义核酸长度,如上面详细所述。通常,杂交核酸越长, 就可以包含与RNA更多的碱基错配,仍然能够形成稳定的双链(或者 三链,根据情况而定)。本领域技术人员能够利用标准方法确定可耐 受的错配度。

用于反义治疗的寡聚核苷酸可以是DNA,RNA或者其嵌合混合物 或者衍生物或者修饰形式,单链或者双链的。可以在例如碱基基团, 糖基团或者磷酸盐骨架上对寡聚核苷酸进行修饰,以提高分子、杂交 的稳定性。寡聚核苷酸可以包括其他附加基团例如肽(例如体内用于 定位到宿主细胞受体),或者促进穿过细胞膜转运(参见,例如,Letsinger 等人,Proc.Natl.Acad.Sci USA 86:6553-6556(1989);Lemaitre等人, Proc.Natl.Acad.Sci USA 84:648-652(1987);PCT国际公开号:WO 88/09810)或者(参见,例如,PCT国际公开号:WO 89/10134)血脑屏 障转运的药剂,或者杂交触发断裂剂(参加,例如,Krol等人, BioTechniques 6:958-976(1988))或者嵌入剂(参见,例如,Zon,Pharm. Res.5:539-549(1988))。所以,寡聚核苷酸可以结合到另一个分子上 (例如,肽,杂交触发交联剂,转运试剂,杂交触发断裂剂)。

反义分子被递送到体内表达TCF7L2的细胞。可以使用多种方法 将反义DNA或者RNA递送到细胞;例如,反义分子可以直接注射到 组织部位,或者设计定位到目标细胞的修饰反义分子(例如,与肽或 者抗体连接的反义分子,所述肽或者抗体特异结合目标细胞表面表达 的受体或者抗原)可以全身给药。此外,在一个优选的实施方式中, 使用重组DNA构建体,其中反义寡聚核苷酸置于强启动子控制下(例 如,pol III或者pol II)。利用这类构建体转染患者的靶细胞,可以引 起足量单链RNAs的转录,它们将与内源TCF7L2转录产物形成互补碱 基对,从而阻止TCF7L2 mRNA的翻译。例如,载体可以导入体内, 因此它被细胞摄取并指导反义RNA的转录。这类载体可以保留为附加 体或者与染色体整合,只要它能够转录产生所需的反义RNA。这类载 体可以通过本领域和上述的标准的DNA重组技术方法进行构建。例如, 质粒,粘粒,YAC或者病毒载体可用于制备能够直接导入组织部位的 重组DNA构建体。此外,可以使用选择性感染目标组织的病毒载体, 这种情况下可以通过其他途径实现给药(例如,全身性的)。

利用靶向同源重组,灭活或者“敲除”基因、核酸或者其启动子, 也也可以减少内源TCF7L2多肽的表达(例如,参见Smithies等人,Nature 317:230-234(1985);Thomas & Capecchi,Cell 51:503-512(1987); Thompson等人,Cell 5:313-321(1989))。例如,可以使用与内源基因或 者核酸(或者编码核酸区域或者调节区域)同源的DNA侧翼的突变、 无功能的基因或者核酸(或者完全无关的DNA序列),包括或者不包 括选择标记物和/或负选择标记物,转染体内表达基因或者核酸的细胞。 通过插入靶向同源重组的DNA构建体,引起基因或者核酸的灭活。重 组DNA构建体可以直接给药,或者利用如上所述的合适载体在体内定 位到所需部位。此外,利用相似方法可以增加非突变基因或者核酸的 表达:靶向同源重组可用于插入DNA构建体,所述DNA构建体在细 胞内包括非突变的功能基因或者核酸,代替上述突变的TCF7L2。在另 一个实施方式中,靶向同源重组可用于插入包括一种核酸的DNA构建 体,所述核酸编码与细胞中存在的不同的II型糖尿病多肽变异体。

此外,通过将互补脱氧核糖核苷酸序列定位到TCF7L2核酸的调 节区域(即,TCF7L2启动子和/或增强子)形成三螺旋结构,阻止体内 靶细胞中TCF7L2核酸的转录,内源TCF7L2核酸的表达可以被降低 (一般参见,Helene,C,Anticancer Drug Des.,6(6):569-84(1991); Helene,C.等人.,Ann.N.Y.Acad.Sci 660:27-36(1992);和Maher,L.J., Bioassays 14(12):807-15(1992))。同样地,本文描述的反义构建体, 通过拮抗TCF7L2蛋白的正常生物活性,可用于组织处理,例如,组织 分化,体内和体外组织培养。此外,反义技术(例如,反义分子的显 微注射,或者和质粒转染,所述质粒的转录产物是II型糖尿病基因 mRNA或者基因序列的反义序列),可用于研究疾病进展中的TCF7L2 功能或者TCF7L2与其结合剂的相互作用,以及成人组织中TCF7L2 的正常细胞功能或者TCF7L2与其结合剂的相互作用。这类技术可用于 细胞培养中,但也可用于转基因动物的制备。

在本发明的另一个实施方式中,本文描述的其他TCF7L2治疗剂 还可用于II型糖尿病基因的治疗。治疗剂可以在上述组合物中,或者 单独给药。它们可以全身给药,或者定位到特定组织。治疗剂可以通 过各种方法制备,包括化学合成;重组产生;体内产生(例如,转基 因动物,例如美国专利号:4,873,316,Meade等人),例如,并可以 用本文描述的那些标准方法分离。

还可以使用任意上述治疗方法的组合(例如,非突变多肽给药和 针对TCF7L2突变mRNA的反义治疗联用;TCF7L2核酸编码第一种剪 接变异体给药和针对TCF7L2核酸编码第二种剪接的反义治疗联用)。

评定对TCF7L2治疗剂反应可能性的方法

本发明还涉及评定个体对TCF7L2治疗剂反应可能性的方法。在 该方法中,评定和TCF7L2基因相关的标记物或者单倍型,如上所述涉 及评定个体对II型糖尿病的易感性。与II型糖尿病易感性(增加的风 险)相关的等位基因,标记物,SNP或者单倍型(例如,标记物DG10S478 除了0等位基因以外其他等位基因;SNP rs12255372的T等位基因; SNP rs7895340的A等位基因;SNP rs11196205的C等位基因;SNP rs7901695的C等位基因;SNP rs7903146的T等位基因;SNP rs12243326 的C等位基因;或者SNP rs4506565的T等位基因;TCF7L2外显子4 LD块相关标记物,例如TCF7L2外显子4LD块相关的风险单倍型); 指示对TCF7L2治疗剂阳性反应的可能性。“阳性反应的可能性”表示 个体比不具有本文所述II型糖尿病易感性(增加的风险)相关等位基 因、标记物、SNP或者单倍型的个体更可能对TCF7L2治疗剂显示阳 性反应。对TCF7L2治疗剂的“阳性反应”是显示II型糖尿病治疗的 生理反应。如上所述,“治疗”不仅指改善II型糖尿病相关症状,而 且还指预防或者延缓II型糖尿病的发病;减轻II型糖尿病症状的严重 程度或者频率;和/或减轻与其他药物联合治疗的必要性,所述其他药 物用来改善II型糖尿病的相关症状。

药物组合物

本发明还涉及药物组合物,包括改变TCF7L2活性或者另外影响 Wnt信号途径或者钙粘蛋白途径,或者可用作TCF7L2治疗剂的药物。 药物组合物还可以与生理上可接受的载体或者赋形剂一起制备成药物 组合物。载体和组合物是无菌的。剂型应当适合给药方式。

合适的药学可接受的载体包括但不限于,水,盐溶液(例如,NaCl), 盐水,缓冲盐水,醇,甘油,乙醇,阿拉伯树胶,植物油,苯甲醇, 聚乙二醇,明胶,糖例如乳糖,直链淀粉或者淀粉,葡萄糖,硬脂酸 镁,滑石,硅酸,粘性石蜡,芳香油,脂肪酸酯,羟甲纤维素,聚乙 烯吡咯烷酮,等等,以及其组合。如果需要,药物制剂可以与辅料混 合,例如,润滑剂,防腐剂,稳定剂,湿润剂,乳化剂,用于影响渗 透压的盐,缓冲液,着色剂,调味剂和/或芳香物质和类似物,它们均 不与活性药剂产生有害反应。

如果需要,组合物还可以包括少量湿润或者乳化剂,或者pH缓冲 剂。组合物可以是液体溶液,悬浮液,乳剂,片剂,药丸,胶囊,缓 释剂型,或者粉末。组合物可以与常规粘合剂和载体例如三酸甘油酯 制备为栓剂。口服剂型可以包括标准载体例如药物等级的甘露醇,乳 糖,淀粉,硬脂酸镁,聚乙烯吡咯烷酮,糖精钠,纤维素,碳酸镁, 等等。

导入这些组合物的方法包括,但不限于,真皮内的,肌肉的,腹 内的,眼内的,静脉内的,皮下的,局部的,口服的和鼻内的。其他 合适的导入方法还包括基因治疗(如下所述),可充电或者可生物降 解装置,粒子加速装置(“基因枪”)和缓释聚合装置。本发明的药 物组合物还可以作为与其他药剂联合治疗的一部分给药。

组合物可以按照常规步骤制备适于给药人类的药物组合物。例如, 用于静脉内给药的组合物通常是无菌等渗水相缓冲液中的溶液。当必 要时,组合物还可以包括增溶剂和局部麻醉剂,以便在注射部位镇痛。 通常,成分是被分别供给或者混合为单位剂型形式,例如,作为密闭 容器例如安瓿或者标记活性药剂数量的小袋(sachette)中的冻干粉末或 者无水浓缩物。当组合物通过输液给药时,它可以在包含无菌药物等 级水、盐水或者葡萄糖/水的输液瓶中配制。当组合物通过注射给药时, 可以提供包含灭菌注射水或者盐水的安瓿,这样在给药前就可以将成 分混合。

对于局部施用,可以使用非喷雾形式,包括一种载体的粘性的至 半固体或者固体形式,所述载体适于局部施用并且其动态粘滞度优选 的大于水。合适制剂包括但不限于溶液,悬浮液,乳剂,乳膏剂,软 膏,粉末,灌肠剂,洗液,溶胶,搽剂,油膏剂,气雾剂,等等,如 果需要,它们被灭菌或者与辅料混合,例如,防腐剂,稳定剂,湿润 剂,缓冲液或者用于影响渗透压的盐,等等。药剂可以整合到化妆品 制剂中。对于局部施用,可喷雾的气雾剂也是合适的,其中活性成分, 优选的与固体或者液体惰性载体材料组合,包装在挤瓶中或者与增压 的挥发性、通常是气体的喷射剂混合,例如压缩空气。

本文描述的药剂可以配制为中性或者盐形式。药学可接受的盐包 括那些与自由氨基形成的盐,例如源自盐酸,磷酸,醋酸,草酸,酒 石酸,等等的盐,和那些与自由羧基形成的盐,例如来自钠,钾,铵, 钙,氢氧化铁,异丙胺,三乙胺,2-乙基氨基乙醇,组氨酸,普鲁卡因, 等等的盐。

给药治疗有效量的药剂。药剂的治疗有效量部分取决于疾病的性 质和/或症状的程度,可以通过标准临床技术确定,此外,可以任选选 用体外或者体内检测帮助确定最适剂量范围。制剂中使用的精确剂量 还取决于给药途径和症状的严重性,这应该根据医师的判断和各个患 者的情况来决定。可以从来自体外或者动物模型检测系统的剂量反应 曲线外推出有效剂量。

本发明还提供药物包装或者试剂盒,包括一个或者多个装满本发 明药物组合物中一种或者多种成分的容器。可选的这类容器中还可以 包括管理药物或者生物制品生产、使用或者销售的政府部门出具的通 告,该通告表明政府批准用于人类给药的制备、使用或者销售。包装 或者试剂盒可以标注关于给药方式,药物给药顺序(例如,分别、连 续或者同时)或者类似的相关信息。包装或者试剂盒还可以包括一些 方法提醒患者采取治疗。包装或者试剂盒可以是组合治疗的单一单位 剂量,或者它可以是多个单位剂量。具体的,药剂可以是单独的,以 任意组合混合的,存在于单个小瓶或者片剂中的。药剂组装成泡状包 装或者其他配药装置中是优选的。对本发明的目的来说,单位剂量是 为了表示一种剂量,所述剂量取决于各种药剂的个体药效学,在标准 时程按FDA批准的剂量给药。

筛选试验和由此鉴定的药剂

本发明还提供鉴定药剂(例如,融合蛋白,多肽,模拟肽,前体 药物,受体,结合剂,抗体,小分子或者其他药物,或者核酶)的方 法,所述药剂改变(例如,增加或者降低)TCF7L2的活性,或者与 TCF7L2或者Wnt信号途径或者钙粘蛋白途径的其他成员(例如,beta- 连环蛋白)相互作用。例如,在某些实施方式中,这类药剂可以与 TCF7L2结合;对例如TCF7L2的活性具有刺激或者抑制效果;或者改 变(例如,增强或者抑制)TCF7L2与Wnt信号途径其他成员或者与钙 粘蛋白途径成员相互作用的能力,或者改变TCF7L2的翻译后加工。在 其他实施方式中,这类药剂改变Wnt信号途径或者钙粘蛋白途径的活 性或者功能。

在一个实施方式中,本发明提供筛选与TCF7L2蛋白(或者其生 物活性部分)结合或者改变其活性的候选或者待测药剂的方法,以及 通过该方法鉴定的药剂。待测药剂可以利用本领域已知的的组合文库 方法中的任意一种方法来获得,包括:生物文库;空间寻址平行固相 或者液相文库;需要去卷积(deconvolution)的合成文库方法;‘一- 珠一-化合物′(′one-bead one-compound′)文库方法;和利用亲和层析 选择法的合成文库。生物文库方法限于多肽文库,而其他4种方法适 于多肽、非肽寡聚物或者化合物的小分子文库(Lam,K.S.,Anticancer Drug Des.12:145(1997))。

在一个实施方式中,为鉴定改变TCF7L2活性的药剂,包含或者 表达TCF7L2或者其片段或者衍生物的细胞、细胞裂解产物或者溶液, 可以与待测药剂接触;或者,蛋白可以直接与待测药剂接触。TCF7L2 活性的水平(数量)被测定(例如,直接或者间接地检测TCF7L2活性 的水平(数量)),并与对照(即,在待测药剂不存在的条件下TCF7L2 蛋白或者其活性片段或者衍生物活性的水平)活性的水平比较。如果 药剂存在时活性水平不同于药剂不存在时的活性水平,并且差值是统 计上有显著意义的,则该药剂是改变TCF7L2活性的药剂。活性水平相 对于对照的增加,表示该药剂是增强活性的药剂(是激动剂)。类似 地,活性水平相对于对照的降低,表示该药剂是抑制活性的药剂(是 拮抗剂)。在另一个实施方式中,待测药剂存在条件下TCF7L2或者其 衍生物或者片段活性的水平与先前建立的对照水平进行比较。如果药 剂存在条件下活性水平与对照水平的差值统计上有显著意义,则表示 药剂改变TCF7L2的活性。

本发明还涉及鉴定药剂(例如,反义核酸,融合蛋白,多肽,模 拟肽,前体药物,受体,结合剂,抗体,小分子或者其他药物,或者 核酶)的检测法,所述药剂改变(例如,增加或者降低)TCF7L2基因 的表达(例如,转录或者翻译),或者与TCF7L2的相互作用,以及涉 及通过该检测法鉴定的药剂。例如,包含编码TCF7L2的核酸的溶液可 以与待测药剂接触。溶液可以包括,例如,包含核酸的细胞或者包含 核酸的细胞裂解产物;此外,溶液可以是包括核酸转录/翻译必需成分 的其他溶液。如果需要,还可以使用未悬浮在溶液中的细胞。TCF7L2 表达的水平和/或模式(例如,mRNA或者蛋白表达的水平和/或模式, 例如不同剪接变异体的水平和/或模式)被测定,与对照表达的水平和/ 或模式(即,待测药剂不存在时TCF7L2表达的水平和/或模式)进行 比较。如果药剂存在时的水平和/或模式与药剂不存在时的水平和/或模 式有差异,并且差值在统计上有显著意义或者以统计上有显著意义的 方式不同,则该药剂是改变II型糖尿病基因表达的药剂。TCF7L2表达 的增强表示该药剂是TCF7L2活性的激动剂。类似地,TCF7L2表达的 抑制表示该药剂是TCF7L2活性的拮抗剂。在另一个实施方式中,待测 药剂存在条件下TCF7L2多肽(例如,不同的剪接变异体)的水平和/ 或模式与先前建立的对照水平和/或模式进行比较。如果药剂存在条件 下水平和/或模式与对照水平和/或模式有差异,其差值在统计上有显著 意义或者以统计上有显著意义的方式不同,则表示药剂改变TCF7L2 表达。

在本发明的另一个实施方式中,利用包含编码TCF7L2基因启动 子区域的核酸或者与报告基因可操作连接的核酸的细胞、细胞裂解产 物或者溶液,可以鉴定出改变TCF7L2表达或者与TCF7L2或者与Wnt 信号途径或者钙粘蛋白途径其他成员相互作用的药剂。与待测药剂接 触后,测定报告基因的表达水平(例如,mRNA或者蛋白表达的水平), 与对照的表达水平(即,待测药剂不存在条件下报告基因的表达水平) 进行比较。如果药剂存在时水平与药剂不存在时的水平有差异,其差 值是统计上有显著意义的或者是以统计上有显著意义的方式不同,则 该药剂是改变TCF7L2表达的药剂,因为显示它具有改变基因表达的能 力,所述基因与TCF7L2基因启动子可操作的连接。报告基因表达的增 强表示该药剂是TCF7L2活性的激动剂。类似地,报告基因表达的抑制 表示该药剂是TCF7L2活性的拮抗剂。在另一个实施方式中,待测药剂 存在条件下报告基因表达的水平与先前建立的对照水平进行比较。如 果药剂存在条件下水平与对照水平有差异,其差值在统计上有显著意 义或者以统计上有显著意义的方式不同,表示该药剂改变表达。

利用上述这些方法可以轻易的鉴定改变TCF7L2编码的不同剪接 变异体量(例如,增强第一种剪接变异体活性的药剂,和抑制第二种 剪接变异体活性的药剂)的药剂,以及是第一种剪接变异体活性激动 剂和第二种剪接变异体活性拮抗剂的药剂。

在本发明的其他实施方式中,该检测可用于评定待测药剂对 TCF7L2结合剂相关多肽活性的影响。例如,表达与TCF7L2多肽相互 作用的化合物(本文中称为“TCF7L2结合剂”,它可以是与TCF7L2 多肽直接或者间接作用的多肽或者其他分子,例如Wnt信号途径的成 员或者钙粘蛋白途径的成员)的细胞,在待测药剂存在条件下与 TCF7L2接触,检测待测药剂改变TCF7L2和TCF7L2结合剂相互作用 的能力。此外,可以使用包含TCF7L2结合剂的细胞裂解产物或者溶液。 通过干扰或者增强TCF7L2与TCF7L2结合剂结合、交联或者另外相互 作用的能力,与TCF7L2或者TCF7L2结合剂结合的药剂可以改变相互 作用。检测待测药剂结合TCF7L2或者TCF7L2结合剂的能力可以通过 下述方法实现,例如,将待测药剂与放射性同位素或者酶标记物偶联, 这样的话待测药剂与多肽的结合可以通过直接或者间接检测125I,35S, 14C或者3H标记,和放射性直接计数或者闪烁计数的放射性同位素检 测。此外,待测药剂可以酶联标记有,例如,辣根过氧化酶,碱性磷 酸酶,或者荧光素酶,和通过测定适合底物向产物的转化检测的酶标 记物。在本发明范围内的还包括检测待测药剂与多肽相互作用的能力, 所述相互作用物都没有进行标记。例如,微生理计可用于检测待测药 剂与TCF7L2或者TCF7L2结合剂的相互作用,所述待测药剂,TCF7L2 或者TCF7L2结合剂都没有进行标记。McConnell,H.M.等人,Science 257:1906-1912(1992)。本文使用的“微生理计”(例如,CytosensorTM) 是一种分析仪器,利用光寻址电位传感器(LAPS)测量细胞酸化其环 境的速率。酸化速率的变化可用作配体和多肽之间相互作用的指示剂。

因此,这些受体可用于筛选作为激动剂或者拮抗剂的化合物,以 用于II型糖尿病易感性的治疗或者研究。可以设计药物调控TCF7L2 活化,从而可用于调控信号途径和下游基因的转录事件。

在本发明的另一个实施方式中,检测法可用于鉴定与TCF7L2相 互作用的多肽。例如,例如Fields和Song(Fields,S.和Song,O.,Nature 340:245-246(1989))描述的酵母双杂系统可用于鉴定与TCF7L2相互 作用的多肽。在这类酵母双杂系统中,载体的构建是基于转录因子的 灵活性,所述转录因子具有两个功能结构域(DNA结合结构域和转录 活化结构域)。如果两个结构域是分离的但融合到两个不同但彼此相 互作用的蛋白,可以实现转录激活,特定标记物(例如,营养标记物 的转录例如His和Ade,或者显色标记物例如lacZ)的转录可用于鉴定 相互作用和翻译激活的存在。例如,在本发明的方法中,使用的第一 种载体包括编码DNA结合结构域以及TCF7L2,剪接变异体,或者其 片段或者衍生物的核酸,使用的第二种载体包括编码转录激活结构域 的核酸以及编码一种多肽的核酸,所述多肽可能与TCF7L2或者剪接变 异体或者其片段或者衍生物相互作用。在合适条件(例如,例如Clontech (Palo Alto,California,USA)的MatchmakerTM系统中使用的交配条件) 下孵育包含第一种和第二种载体的酵母,就可以鉴定表达感兴趣的标 记物的菌落。检查这些菌落可以鉴定与TCF7L2或者其片段或者衍生物 相互作用的多肽。这类多肽可以用作改变TCF7L2表达活性的药剂,如 与治疗方法相关方面所述。

在本发明上述检测法的不止一个实施方式中,可能需要将TCF7L2 基因,TCF7L2蛋白,TCF7L2结合剂(例如,Wnt信号途径或者钙粘 蛋白途径的其他成员),或者检测法中的其他组分固定到固相支持物 上,以便促进一种或者两种蛋白复合与非复合形式的分离,以及适应 检测自动化。在待测药剂存在或者不存在的条件下,待测药剂与蛋白 的结合,或者蛋白与结合剂的相互作用,可以在任何适于包含反应物 的容器中进行。这类容器的实例包括微量滴定板,试管和微量离心管。 在一个实施方式中,可以提供融合蛋白(例如,谷胱甘肽-S-转移酶融 合蛋白),其添加一个TCF7L2,TCF7L2蛋白或者TCF7L2结合剂结 合到基质或者其他固相支持物上的结构域。

在另一个实施方式中,采用一种方法鉴定本发明核酸分子的表达 调节物,其中包含TCF7L2的细胞,细胞裂解产物或者溶液与待测药剂 接触,然后检测细胞,细胞裂解产物或者溶液中相应mRNA或者多肽 (例如剪接变异体)的表达。待测药剂存在条件下相应mRNA或者多 肽的表达水平与待测药剂不存在条件下mRNA或者多肽的表达水平进 行比较。基于这种比较,待测药剂可以被鉴定为表达调节物。例如, 待测药剂存在条件下比其缺失条件下mRNA或者多肽的表达更高(统 计上显著的更高),则待测药剂被鉴定为mRNA或者多肽表达的激发 剂或者增强剂。此外,待测药剂存在条件下比其缺失条件下mRNA或 者多肽的表达更低(统计上显著的更低),则待测药剂被鉴定为mRNA 或者多肽表达的抑制剂。可以采用本文描述的检测mRNA或者多肽的 方法检测细胞中mRNA或者多肽的表达水平。

本发明还涉及利用上述筛选检测方法鉴定的新的药剂。因此,在 本文所述治疗方法中进一步使用本文所述鉴定的药剂也在本发明的范 围内。例如,通过将蛋白或者核酸(或者包括多肽或者核酸的细胞) 与本文所述鉴定的药剂接触,本文所述鉴定的药剂可用于改变TCF7L2 基因编码蛋白的活性,或者改变TCF7L2的表达。

本发明的核酸

TCF7L2核酸,部分和变异体

本发明还涉及包括人TCF7L2的分离的核酸分子。本发明的 TCF7L2核酸分子可以是RNA,例如,mRNA,或者DNA,例如cDNA 和基因组DNA。DNA分子可以是双链或者单链;单链RNA或者DNA 可以是编码或者正义链,或者非编码或者反义链。核酸分子可以包括 全部或者部分基因编码序列,还可以包括其他非编码序列,例如内含 子和非编码3′和5′序列(例如,包括调控序列)。

此外,本发明的核酸分子可以融合到标记物序列,例如,编码一 种多肽的序列,其帮助多肽的分离或者纯化。这类序列包括,但不限 于,编码谷胱甘肽-S-转移酶(GST)融合蛋白和编码流感血凝素A(HA) 多肽标记物的序列。

本文使用的“分离的”核酸分子,是指那些与,通常位于基因或 者核苷酸序列(如在基因组序列内)侧翼的核酸分离和/或已经完全或 者部分从其他转录序列纯化(例如,在RNA文库内)。例如,本发明 的分离核酸,相对于其天然产生的复杂细胞环境,或者当通过重组技 术产生时的培养基,或者当化学合成时化学前体或者其他化学制剂, 是基本上分离的。在有些情况下,分离的材料将成为组合物(例如, 包含其他物质的粗提物),缓冲系统或者试剂混合物的一部分。在其 他情况下,材料可以纯化到例如通过PAGE或者柱层析法例如HPLC 检测基本均一的。优选的,分离的核酸分子包括至少大约50,80或者 90%(摩尔比)的所有存在的高分子种类。就基因组DNA而言,术语 “分离的”还指与染色体分离的核酸分子,所述染色体与基因组DNA 是天然关联的。例如,分离核酸分子可以包含小于大约5kb但不限于 4kb,3kb,2kb,1kb,0.5kb或者0.1kb的核苷酸,其在细胞基因组DNA 内核酸分子的侧翼,所述细胞是核酸分子的来源。

核酸分子可以融合到其他编码或者调控序列,仍然被看作是分离 的。因此,包括在载体内的重组DNA属于本文使用的“分离的”定义。 此外,分离核酸分子包括异源宿主细胞内的重组DNA分子,以及溶液 中部分或者基本上纯化的DNA分子。“分离的”核酸分子还包括本发 明DNA分子的体内和体外RNA转录产物。分离的核酸分子可以包括 化学或者重组方法合成的核酸分子或者核酸序列。因此,包括在载体 内的重组DNA属于本文使用的“分离的”定义。此外,分离的核酸分 子包括异源生物内的重组DNA分子,以及溶液中部分或者基本上纯化 的DNA分子。本发明DNA分子的体内和体外RNA转录产物也包括在 “分离的”核酸序列中。这类分离核酸分子可用于编码多肽的制备, 作为分离同源序列(例如,来自其他哺乳动物种类)的探针,用于基 因作图(例如,通过与染色体的原位杂交),或者用于检测组织中基 因的表达(例如,人组织),例如通过Northern或者Southern印迹分 析。

本发明还涉及核酸分子,所述核酸分子不必在自然界被发现,但 其编码TCF7L2多肽,或者TCF7L2多肽的其他剪接变异体或者其多态 性变异体。因此,例如,本发明涉及包括一种不同于天然存在的核苷 酸序列的DNA分子,所述序列由于遗传密码的简并性,编码本发明的 TCF7L2多肽。本发明还包括编码部分(片段)或者编码变异体多肽的 核酸分子,所述变异体多肽例如TCF7L2多肽的类似物或者衍生物。这 类变异体可以是天然存在的,例如等位基因变异或者单核苷酸多态性, 或者非天然存在的,例如通过不同诱变剂和诱变处理进行诱导。预计 的变异包括,但不限于,一个或多个核苷酸的添加,缺失和取代,这 引起保守或者非保守氨基酸的改变,包括添加和缺失。优选的核苷酸 (和/或生成的氨基酸)改变是沉默或者保守的;即,它们不改变TCF7L2 多肽的特征或者活性。一方面,核酸序列是包括一种或者多种多态性 微卫星标记物的片段。另一方面,核苷酸序列是包括一种或者多种 TCF7L2基因单核苷酸多态性的片段。

本发明核酸分子的其他改变可以包括,例如,标记,甲基化,核 苷酸间修饰例如无电荷键(例如,膦酸甲酯,磷酸三酯,磷酸酰胺, 氨基甲酸酯),带电荷键(例如,硫代磷酸酯,二硫代磷酸酯),侧 基(例如,多肽),嵌入剂(例如,吖啶,补骨脂素),螯合剂,烷 化剂(alkylators),和修饰键(例如,alpha异头核酸)。合成分子也 被包括在内,所述合成分子模拟核酸分子通过氢键作用和其他化学相 互作用与指定序列结合的能力。这类分子包括,例如,那些分子骨架 上肽键代替磷酸酯键的分子。

本发明还涉及在高严谨性杂交条件下与本文所述核苷酸序列杂交 的核酸分子(例如,与编码多肽的核苷酸序列特定杂交的核酸分子, 该多肽是本文描述的或者具有上述多肽的活性),例如选择性杂交。 一方面,本发明包括本文所述的变异体,该变异体在高严谨性杂交条 件(例如,选择性杂交)下与编码氨基酸序列或者其多态性变异体的 核苷酸序列杂交。另一方面,在高严谨性杂交条件下杂交的变异体具 有TCF7L2多肽的活性。

这类核酸分子可以通过特异杂交(例如,在高严谨性条件下)进 行检测和/或分离。本文使用的“特异杂交”是指第一种核酸与第二种 核酸以某种方式杂交的能力,所述方式使第一种核酸不与第二种核酸 以外的所有核酸杂交(例如,当样品中第一种核酸与第二种核酸的相 似性比任意其他核酸都要高时,才进行杂交)。杂交的“严谨性条件” 是本领域的术语,是指孵育和洗涤条件,例如温度和缓冲液浓度条件, 允许特定核酸与第二种核酸的杂交;第一种核酸可以与第二种核酸完 全(即,100%)互补,或者第一种和第二种核酸的互补程度比完全互 补低(例如,70%,75%,85%,90%,95%)。例如,某些高严谨性 条件可以区分完全互补的核酸和互补性稍低的核酸。“高严谨性条 件”,“中等严谨性条件”和“低严谨性条件”,以及核酸杂交方法 阐述于Current Protocols in Molecular Biology的2.10.1-2.10.16页和 6.3.1-6.3.6页(Ausubel,F.等人,″Current Protocols in Molecular Biology″,John Wiley & Sons,(1998)),和Kraus,M.和Aaronson,S., Methods Enzymol,200:546-556(1991)。

通过比对序列用于最优的比较目的(例如,缺口可以导入至第一 个序列的序列用于最优比对),可以确定两种核苷酸或者氨基酸序列 同源性或者同一性的百分比。然后比较对应位置的核苷酸或者氨基酸, 两个序列之间的百分相同比是序列共有的相同位置的数目的函数(即, %同一性=相同位置的数目/位置的总数×100)。当一个序列中的一个 位置被另一个序列对应位置上相同的核苷酸或者氨基酸残基占据时, 则上述分子在该位置是同源的。本文使用的核酸或者氨基酸“同源性” 等同于核酸或者氨基酸“同一性”。某些情况下,用于比较目的而比 对的序列的长度至少是参照序列长度的30%,例如,至少40%,某些 情况下至少60%,和其他情况下至少70%,80%,90%或者95%。两个 序列的有效比较可以利用公知方法进行,例如,利用一种数学算法。 这类数学算法一个优选的、非限制性实例描述于Karlin等人,Proc. Natl.Acad.Sci USA 90:5873-5877(1993)。这种算法被整合到NBLAST 和XBLAST程序(2.0版本),描述于Altschul等人,Nucleic Acids Res. 25:389-3402(1997)。当使用BLAST和Gapped BLAST程序时,可以 使用相应程序(例如,NBLAST)的缺省参数。一种情况下,序列比较 的参数设为值=100,字长(W)=12,或者可以改变(例如,W=5或 W=20)。

用于序列比较的数学算法的另一个优选、非限制性实例是Myers 和Miller的算法,CABIOS 4(1):11-17(1988)。这种算法被整合到 ALIGN程序(2.0版本),属于GCG序列比对程序包的一部分(Accelrys, Cambridge,UK)。当利用ALIGN程序比较氨基酸序列时,可以使用 PAM 120权重残差表(weight residue table),间隙长度罚分(gap length penalty)12,和缺口罚分(gap penalty)4。其他用于序列分析的算法 是本领域公知的,包括Torellis和Robotti描述的ADVANCE和ADAM, Comput.Appl.Biosci.10:3-5(1994);以及Pearson和Lipman描述的 FASTA,Proc.Natl.Acad.Sci.USA 85:2444-8(1988)。

另一方面,两个氨基酸序列间的同一性百分比可以利用GCG程序 包中的GAP程序计算,使用BLOSUM63矩阵或者PAM250矩阵,缺 口权重(gap weight)为12、10、8、6或者4,长度权重(length weight) 为2、3或者4。另一方面,两个核酸序列间的同一性百分比可以利用 GCG程序包中的GAP程序计算,使用缺口权重(gap weight)50和长 度权重(length weight)3。

本发明还提供分离的核酸分子,所述核酸分子包含在高严谨性条 件下与TCF7L2核苷酸序列或者这种序列的互补序列杂交的片段或者 部分,还提供分离的核酸分子,所述核酸分子包含在高严谨性条件下 与编码氨基酸序列或者其多态性变异体的核苷酸序列杂交的片段或者 部分。本发明的核酸片段长度是至少大约15,优选的至少大约18,20, 23或者25个核苷酸,并且长度可以是30,40,50,100,200或者更 多个核苷酸。越长的片段,例如,长度是30或者更多个核苷酸,其编 码本文所述抗原多肽,对例如下文所述的抗体生产是非常有用的。

探针和引物

在相关方面,本发明的核酸片段用作例如本文所述检测法中的探 针或者引物。“探针”或者“引物”是以碱基特异方式与核酸分子互 补链杂交的寡聚核苷酸。这类探针和引物包括多肽核酸,如Nielsen等 人描述,Science 254:1497-1500(1991)。

探针或者引物包括与核酸分子的至少大约15个,例如大约20-25 个,和在一些情况下大约40、50或者75个连续核苷酸杂交的核苷酸 序列区域,所述核酸分子包括TCF7L2或者其多态性变异体的连续核苷 酸序列。在其他情况下,探针或者引物包括100个或者更少的核苷酸, 在一些情况下从6到50个核苷酸,例如从12到30个核苷酸。在其他 情况下,探针或者引物与连续核苷酸序列或者连续核苷酸序列的互补 序列至少有70%的相似性,例如至少80%同一性,在一些情况下至少 90%同一性,和在其他情况下至少95%同一性,或者甚至能够与连续核 苷酸序列或者连续核苷酸序列的互补序列选择性杂交。通常,探针或 者引物还包括标记物,例如,放射性同位素,荧光化合物,酶,或者 酶辅因子。

利用标准分子生物学技术和本文提供的序列信息,可以鉴定和分 离如上所述的本发明核酸分子。例如,根据TCF7L2或者该序列的互补 序列设计的,或者根据编码本文提供的一种或者多种氨基酸序列的核 苷酸序列设计的合成寡聚核苷酸引物,利用聚合酶链式反应扩增和分 离核酸分子。通产参见PCR Technology:Principles and Applications for DNA Amplification(ed.H.A.Erlich,Freeman Press,NY,NY,1992); PCR Protocols:A Guide to Methods and Applications(Eds.Innis等人, Academic Press,San Diego,CA,1990);Mattila等人,Nucl.Acids Res.19: 4967(1991);Eckert等人,PCR Methods and Applications 1:17(1991); PCR(eds.McPherson等人,IRL Press,Oxford);和美国专利4,683,202。 可以利用cDNA,mRNA或者基因组DNA作为模板扩增核酸分子,克 隆到合适载体,通过DNA序列分析进行表征。

其他合适的扩增方法包括连接酶链式反应(LCR)(参见Wu和 Wallace,Genomics 4:560(1989),Landegren等人,Science 241:1077 (1988),转录扩增(Kwoh等人,Proc.Natl.Acad.Sd.USA 86:1173 (1989)),和自主序列复制(Guatelli等人,Proc.Nat.Acad.Sd.USA 87: 1874(1990))和依赖核酸的序列扩增(NASBA)。后两个扩增方法涉 及基于等温转录的等温反应,产生的扩增产物为单链RNA(ssRNA) 和双链DNA(dsDNA),比例分别为大约30或者100比1。

扩增的DNA可以被标记,例如,放射性标记,并用作筛选cDNA 文库的探针,所述cDNA文库来自人细胞,在zap表达,ZIPLOX或者 其他合适载体中的mRNA。可以分离相应克隆,体内切割后获得DNA, 利用本领域公知的方法可以对克隆的插入物进行单向或者双向测序, 鉴定编码合适分子量多肽的正确读码框。例如,利用商品化供应的公 知方法可以对本发明核酸分子的核苷酸序列进行直接分析。参见,例 如,Sambrook等人,Molecular Cloning,A Laboratory Manual(2nd Ed., CSHP,New York 1989);Zyskind等人.,Recombinant DNA Laboratory Manual,(Acad.Press,1988))。此外,荧光方法也可用于分析核酸(Chen 等人,Genome Res.9,492(1999))和多肽。利用这些或者相似方法,多 肽和编码多肽的DNA可以被分离、测序和表征。

本发明的反义核酸分子可以根据TCF7L2核苷酸序列和/或互补序 列或者部分核苷酸序列设计,按照本领域公知的步骤,利用化学合成 和酶连接反应构建。例如,反义核酸分子(例如,反义寡聚核苷酸) 可以利用天然存在的核苷酸或者不同修饰的核苷酸化学合成,所述修 饰是为了提高分子的生物稳定性或者提高反义和正义核酸之间形成的 双链的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的 核苷酸。此外,反义核酸分子可以利用表达载体生物合成,在所述载 体中沿反义方向已经亚克隆了核酸分子(即,从插入的核酸分子转录 的RNA对于感兴趣的靶核酸是反义方向)。

核酸序列还可以用于与患者的内源DNA序列进行比较,以鉴定如 上所述的一种或者多种病症,并且可以用作探针,这样就可以从样品 中杂交和发现相关DNA序列或者排除已知序列。核酸序列还可以用于 产生遗传指纹法的引物,利用DNA免疫技术生产抗-多肽抗体,以及 作为抗原产生抗-DNA抗体或者激发免疫应答。本文鉴定的核苷酸序 列的部分或者片段(和对应的完整基因序列)可在许多方面应用,例 如多核苷酸试剂。例如,这些序列可用于:(i)在染色体上对它们各 自的基因作图;和,因此,定位与遗传疾病相关的基因区域;(ii)从 少量生物样品中鉴定个体(组织分型);和(iii)帮助生物样品的法医 鉴定。此外,本发明的核苷酸序列可用于鉴定和表达重组多肽,所述 重组多肽用于分析、表征或者治疗用途,或者作为组织标记物,其中 对应多肽组成性表达,在组织分化期间表达或者在患病状态下表达。 该核酸序列还可用作本文所述筛选和/或诊断方法中的试剂,还可以作 为本文所述筛选和/或诊断方法所用试剂盒(例如,试剂盒)的组分。

用于诊断方法的试剂盒(例如,reagent kits)包括在本文所述任意 方法中适用的组分,包括例如,本文描述的杂交探针或者引物(例如, 标记的探针或者引物),检测标记分子的试剂,限制性酶(例如,用 于RFLP分析),等位基因特异的寡聚核苷酸,与突变或者非突变(天 然)TCF7L2多肽结合的抗体,包括TCF7L2核酸或者TCF7L2的一部 分的核酸扩增工具,或者如本文描述的分析TCF7L2核酸或者分析 TCF7L2多肽氨基酸序列的核酸序列的工具,等等。一方面,诊断II 型糖尿病易感性的试剂盒可以包括用于扩增TCF7L2核酸内区域的引 物,所述区域包含在患有II型糖尿病或者II型糖尿病易感的个体频率 更高的标记物DG10S478,SNP rs12255372,rs895340,rs11196205, rs7901695,rs7903146,rs12243326和/或rs4506565,或者风险单倍型。 可以根据SNPs侧翼的核酸部分设计引物,所述SNPs指示II型糖尿病。

载体和宿主细胞

本发明的另一方面涉及包含本文所述核酸分子和其互补序列(或 者其一部分)的核酸构建体。该构建体包括载体(例如,表达载体), 其中本发明的序列已经按正义或者反义方向插入载体中。本文使用的 术语“载体”是指能够转运与其连接的另一种核酸分子的核酸分子。 一类载体是“质粒”,指可以连接其他DNA片段的环状双链DNA环。 另一类载体是病毒载体,其中其他DNA片段可以连接到病毒基因组中。 某些载体能够在它们被导入的宿主细胞中自主复制(例如,具有细菌 复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如,非 附加型哺乳动物载体)在导入宿主细胞时整合到宿主细胞的基因组中, 从而随宿主基因组进行复制。表达载体能够指导与它们可操作连接的 基因的表达。重组DNA技术中表达载体的应用通常是采取质粒形式。 但是,本发明预期包括这类其他形式的表达载体,例如具有等同功能 的病毒载体(例如,复制缺陷型逆转录病毒,腺病毒和腺相关病毒)。

在一些情况下,本发明的重组表达载体包括本发明的核酸分子, 所述核酸分子的形式适于宿主细胞中的核酸分子表达。这表明重组表 达载体包括一种或者多种调控序列,根据待用于表达的宿主细胞进行 选择,所述载体与待表达的核酸序列可操作的连接。在重组表达载体 内,“可操作的连接”或者“操作的连接”是指感兴趣的核苷酸序列 以某种方式连接到调控序列,该方式允许该核苷酸序列的表达(例如, 在体外转录/翻译系统或者当载体导入宿主细胞时在宿主细胞中)。术 语“调控序列”包括启动子,增强子和其他表达控制元件,(例如, 多腺苷酸化信号)。这类调控序列描述于,例如,Goeddel,″Gene Expression Technology″,Methods in Enzymology 185,Academic Press, San Diego,CA(1990)。调控序列包括那些在许多类型的宿主细胞中指 导核苷酸序列组成性表达和只在某些宿主细胞中指导核苷酸序列表达 (例如,组织-特异调控序列)的序列。本领域技术人员应了解表达载 体的设计取决于这类因素,如待转化宿主细胞的选择和所需的多肽表 达水平。本发明的表达载体可以导入宿主细胞从而产生本文所述核酸 分子编码的多肽,包括融合多肽。

本发明的重组表达载体可以设计成在原核或者真核细胞中表达本 发明的多肽,例如,细菌细胞例如E.coli,昆虫细胞(利用杆状病毒表 达载体),酵母细胞或者哺乳动物细胞。合适的宿主细胞还描述于 Goeddel,supra。此外,重组表达载体可以在体外转录和翻译,例如利 用T7启动子调控序列和T7聚合酶。

本发明的另一方面涉及被导入本发明重组表达载体的宿主细胞。 术语“宿主细胞”和“重组宿主细胞”是在本文中是可以互换使用的。 应了解这类术语不仅指特定个体细胞而且还指这类细胞的后代或者潜 在后代。由于突变或者环境影响后继世代可能存在某些修饰,这类后 代实际上可能不同于母细胞,但仍然包括在本文使用的该术语范围内。

宿主细胞可以是任意的原核或者真核细胞。例如,本发明的核酸 分子可在细菌细胞(例如,E.coli),昆虫细胞,酵母或者哺乳动物细 胞(例如中国仓鼠卵巢细胞(CHO)或者COS细胞)中表达。其他合 适的宿主细胞是本领域技术人员公知的。

载体DNA可以通过常规转化或者转染技术导入原核或者真核细 胞。本文使用的的术语“转化”和“转染”是指将外源核酸分子(例 如,DNA)导入宿主细胞的本领域已知的各种技术,包括磷酸钙或者 氯化钙共沉淀,DEAE-葡聚糖介导的转染,脂质体转染或者电穿孔。 转化或者转染宿主细胞的合适方法可参见Sambrook等人(supra)和其 他实验手册。

对于哺乳动物细胞的稳定转染,众所周知,依赖于使用的表达载 体和转染技术,只有小部分细胞可以将外源DNA整合到它们的基因组 中。为了鉴定和选择这些整合体,编码选择性标记物(例如,抗生素 抗性)的基因通常和感兴趣的基因一起导入宿主细胞。优选的选择标 记物包括那些产生抗药性的标记物,例如G418,潮霉素和氨甲蝶呤。 编码选择性标记物的核酸分子可以与本发明的核酸分子在相同载体上 导入宿主细胞,或者在单独载体上导入。稳定转染有导入的核酸分子 的细胞可通过药物选择鉴定(例如,整合选择性标志物基因的细胞存 活,而其他细胞死亡)。

本发明的宿主细胞,例如培养的原核或者真核宿主细胞可用于产 生(即,表达)本发明的多肽。因此,本发明还提供利用本发明的宿 主细胞产生多肽的方法。一方面,该方法包括在合适培养基中培养本 发明的宿主细胞(其中已经导入编码本发明多肽的重组表达载体)以 产生多肽。另一方面,该方法还包括从培养基或者宿主细胞分离多肽。

本发明的抗体

本发明还提供与一种形式的基因产物特异结合而不与另一种形式 的基因产物结合的多克隆抗体和/或单克隆抗体。本发明还提供与变异 体或者参照基因产物的一部分结合的抗体,所述变异体或者参照基因 产物包含多态性位点。本文使用的术语“抗体”是指免疫球蛋白分子 和免疫球蛋白分子的免疫活性部分,即,包含特异结合抗原的抗原结 合位点的分子。特异结合本发明多肽的分子是与该多肽或者其片段结 合,但基本上不与样品中其他分子结合的分子,所述样品,例如,天 然包含多肽的生物样品。免疫球蛋白分子免疫活性部分的实例包括 F(ab)和F(ab′)2片段,这可以通过用酶例如胃蛋白酶处理抗体产生。本 发明提供结合本发明多肽的多克隆和单克隆抗体。本文使用的术语“单 克隆抗体”或者“单克隆抗体组合物”,是指只包含一种抗原结合位 点的抗体分子集合,所述抗原结合位点能够与本发明多肽特定抗原表 位发生免疫反应。因此单克隆抗体组合物通常对与其发生免疫反应的 本发明特定多肽显示单一结合亲和力。

多克隆抗体可以如上所述制备,利用所需免疫原,例如,本发明 的多肽或者其片段,免疫合适个体。通过标准技术可以随时间监控免 疫个体中的抗体滴度,例如利用固定多肽的酶联免疫吸附(ELISA)。 如果需要,可以从哺乳动物(例如,从血液)分离针对多肽的抗体分 子,采用公知技术进一步纯化,例如蛋白A层析法以获得IgG级分。 在免疫后的合适时间,例如,当抗体滴度最高时,抗体产生细胞可以 从个体获得,并用于通过标准技术制备单克隆抗体,例如杂交瘤技术, 最初描述于Kohler和Milstein,Nature 256:495-497(1975),人B细胞杂 交瘤技术(Kozbor等人,Immunol.Today 4:72(1983)),EBV-杂交瘤 技术(Cole等人,Monoclonal Antibodies and Cancer Therapy,Alan R. Liss,1985,Inc.,pp.77-96)或者三源杂交瘤技术。产生杂交瘤的技术是 已知的(通常参见Current Protocols in Immunology(1994)Coligan等人., (eds.)John Wiley & Sons,Inc.,New York,NY)。概括的说,永生化细 胞系(通常是骨髓瘤)与淋巴细胞(通常是脾细胞)融合,所述淋巴 细胞来自上述免疫原免疫的哺乳动物,筛选所得杂交瘤细胞的培养上 清液,鉴定产生与本发明多肽结合的单克隆抗体的杂交瘤。

大量公知的用于融合淋巴细胞和永生化细胞系的实验规程均可用 于产生本发明多肽的单克隆抗体的目的(参见,例如,Current Protocols in Immunology,supra;Galfre等人,Nature 266:55052(1977);R.H. Kenneth,in Monoclonal Antibodies:A New Dimension In Biological Analyses,Plenum Publishing Corp.,New York,New York(1980);和 Lerner,YaIe J.Biol.Med.54:387-402(1981))。此外,普通技术人员应 了解还存在这类方法的许多变形,它们也是有用的。

制备分泌单克隆抗体的杂交瘤的另外一种方法,利用多肽筛选重 组组合免疫球蛋白文库(例如,抗体噬菌体展示文库)从而分离结合 多肽的免疫球蛋白库成员,可以鉴定本发明多肽的单克隆抗体。用于 产生和筛选噬菌体展示文库的试剂盒是商品化供应的(例如,the Pharmacia Recombinant Phage Antibody System,Catalog No 27-9400-01; 和the Stratagene SurfZAPTM Phage Display Kit,Catalog No 240612)。此 外,特别适用于产生和筛选抗体展示文库的方法和试剂的实例可见于, 例如,美国专利号5,223,409;PCT公开号WO 92/18619;PCT公开号 WO 91/17271;PCT公开号WO 92/20791;PCT公开号WO 92/15679; PCT公开号WO 93/01288;PCT公开号WO 92/01047;PCT公开号WO 92/09690;PCT公开号WO 90/02809;Fuchs等人,Bio/Technology 9: 1370-1372(1991);Hay等人,Hum.Antibod.Hybridomas 3:81-85(1992); Huse等人,Science 1Aβ:1275-1281(1989);和Griffiths等人,EMBO J. 12:725-734(1993)。

此外,利用标准重组DNA技术产生的重组抗体,例如嵌合和人源 化单克隆抗体,包括人和非人部分,也包括在本发明的范围内。这类 嵌合和人源化单克隆抗体可以通过本领域已知的重组DNA技术产生。

通常,本发明的抗体(例如,单克隆抗体)可用于通过标准技术 分离本发明的多肽,例如亲和层析法或者免疫沉淀法。多肽特定抗体 可以帮助从细胞中纯化天然多肽,以及对宿主细胞中表达的重组多肽 进行纯化。此外,对本发明多肽特异的抗体可用于检测多肽(例如, 在细胞裂解产物,细胞上清液或者组织样品中),以便计算多肽的表 达丰度和模式。抗体可以用于诊断用途,作为临床检测方法的一部分 来监控组织中的蛋白水平,例如,确定给定治疗方法的效果。抗体可 以偶联到可检测的物质以帮助其检测。可检测物质的实例包括各种酶, 辅基,荧光材料,发光材料,生物发光材料,和放射性物质。合适酶 的实例包括辣根过氧化酶,碱性磷酸酶,beta-半乳糖苷酶,或者乙酰 胆碱酯酶;合适辅基复合物的实例包括链亲和素/生物素和亲和素/生物 素;合适荧光材料的实例包括伞形酮,荧光素,异硫氰酸荧光素,若 丹明,二氯三嗪胺荧光素,丹磺酰氯或者藻红蛋白;发光材料的实例 包括鲁米诺;生物发光材料的实例包括荧光素酶,荧光素,和水母发 光蛋白,和合适放射性物质的实例包括125I,131I,35S或者3H。

现在通过下列例证解释本发明,其不应当在任一方面被认为是限 制性的。

实施例

此处描述的是利用10q基因座内密集的微卫星标记物,通过单点 关联分析,鉴定转录因子7-样2(TCF7L2-原先的TCF4)为导致患II 型糖尿病风险的基因。

方法

冰岛群组

冰岛数据保护机构(Data Protection Authority of Iceland)和冰岛 国家生物伦理委员会(National Bioethics Committee of Iceland)批准了 此项研究。所有研究参与者都签署了知情同意书。与血液样品、医学 信息和家系相关的所有个人身份资料首先由数据保护机构利用第三方 加密系统(18)(Data Protection Authority)加密。

为了这项研究,2400名II型糖尿病患者被鉴别,他们或者在冰岛 心脏协会(Icelandic Heart Association)过去30年的长期流行病学研究 中被诊断,或者在过去12年中在雷克雅未克(Reykjavik)的两家主要 医院中被诊断。这些患者中的三分之二存活,代表现在已知的大约一 半的冰岛II型糖尿病患者人群。为了这项研究,我们和这些患者中的 大多数进行接触,合作比例超过80%。这项研究的所有参与者都访问 了冰岛心脏协会,在那里他们回答了一份问卷,进行了抽血和空腹血 糖检测。问卷包括关于药物治疗和诊断时年龄的问题。这项研究中的 II型糖尿病患者按照我们先前发表的连锁研究(10)所述的进行诊断。 简单地说,II型糖尿病的诊断由医生根据先前的医疗记录,药物治疗 历史和/或新的实验室测量方法来确认。对于先前确诊的II型糖尿病患 者,使用口服降糖药的报告证实II型糖尿病。当前接受胰岛素治疗的 个体,如果他们也使用或者以前使用口服降糖药,则被划分为患有II 型糖尿病。在这个群组里,大多数接受药物治疗的患者服用口服降糖 药,只有少部分(9%)需要胰岛素。对于至今未能诊断的个体,II 型糖尿病和空腹血糖受损(IFG)的诊断基于美国糖尿病协会(American Diabetes Association)制定的标准(Expert Committee on the Diagnosis and Classification of Diabetes Mellitus 1997)。这项研究中II型糖尿病 患者的平均年龄是69.7岁。

重复群组

丹麦研究组选自丹麦的PERF(Prospective Epidemiological Risk Factors,预期流行病学危险因素)研究(19)。228位女性已经先前确 诊患有II型糖尿病和/或检测出>=7mM血糖。作为对照,539位未患病 (相对II型糖尿病)女性从相同研究群组中随机抽出。

美国的PENN CATH研究是1998年7月至2003年3月期间在宾 夕法尼亚大学医疗中心(University of Pennsylvania Medical Center)接 受心导管插入术的患者连续群组中进行的生化和遗传因素与冠状动脉 粥样硬化关联性的抽样研究(cross sectional study)。II型糖尿病定义 为具有以下病史,空腹血糖>126mg/dl,餐后2小时血糖>200mg/dl,40 岁以上个体中使用口服降血糖药或者胰岛素。宾夕法尼亚大学机构审 查委员会(University of Pennsylvania Institutional Review Board)批准 了研究计划,所有参与者都签署了知情同意书。通过自述进行种族划 分。361个白种人II型糖尿病病例来自这个群组。530位未患病(相对 II型糖尿病和心肌梗死)的白种人对照从相同研究群组中随机抽出。

用于基因分型的DNA是利用GenomiPhi Amplification试剂盒 (Amersham),从丹麦和美国II型糖尿病患者和对照的外周血分离的 DNA的全基因组扩增产物。

基因分型

在94个对照中利用串联重复发现软件(20)鉴定新的序列重复(即 二核苷酸、三核苷酸和四核苷酸重复),检测多态性。CEPH样品1347-02 (CEPH基因组库)低频等位基因碱基对的大小被从微卫星扩增子的大 小中减去,用作参照。利用直接DNA测序(Applied BioSystems)或 者Centaurus平台(Nanogen)进行SNP基因分型。

关联分析的统计方法

对于单一标记物与II型糖尿病的关联,我们使用似然比检验计算 各等位基因的两侧p-值。对于使用的微卫星,我们提供等位基因频率 而不是携带者频率。

我们采用乘法模型(16,17)计算相对危险度(RR)和人群归因 危险度(PAR)。对于CEPH白种人HapMap数据,我们利用D′(21) 和R2(22)的标准定义计算SNPs配对之间的LD。当对全部SNP组合 作图以说明特定区域中的LD结构,我们将D′绘制在左上角,p-值绘制 在右下角。在我们展示的LD图中,标记物绘制成等距的,而不是根据 它们的物理位置。

结果

基因座范围的关联研究

我们过去报道了在冰岛人群中染色体5q与II型糖尿病基因组范围 的显著连锁(10);在相同的研究中,我们还报道与10q和12q连锁 的指示性证据。为了对10q基因座进行研究,我们采用关联方法,利 用对应这个基因座跨越10.5Mb区域(NCBI Build 34: Chr10:114.2-124.7Mb)的高密度的基因分型的微卫星标记物。我们鉴 定和分型了228个微卫星标记物--即一个标记物的平均密度为46kb(表 1)。全部标记物都分型到1185位冰岛II型糖尿病患者和931位无关 的人群对照。

表1:人类基因组集合NCBI Build 34中染色体10上228个基因 分型的微卫星的位置。

  名称   起始:Build 34Chr10位置   结束:Build 34Chr10位置   D10S1269   114186051   114186276   DG10S475   114389853   114390116   D10S168   114410102   114410266   DG10S478   114460845   114461228   DG10S479   114475488   114475632   DG10S480   114507574   114507829   DG10S481   114542657   114542924   DG1OS1624   114545990   114546237   DG10S1625   114568323   114568715   DG10S488   114713594   114714008

  DG10S1630   114770344   114770609   DG10S1631   114778307   114778598   DG10S492   114811884   114812269   DG10S494   114852114   114852280   DG10S495   114879344   114879474   DG10S496   114919414   114919678   DG10S498   114964123   114964270   DG10S500   115024471   115024854   DG10S501   115045332   115045710   DG10S508   115241356   115241602   DG10S1634   115267106   115267460   DG10S512   115357290   115357439   DG10S514   115400157   115400338   DG10S17   115463773   115464048   DG10S1635   115519619   115519900   DG10S520   115536945   115537130   D10S554   115695920   115696071   D10S1237   115784580   115784977   DG10S535   115858565   115858720   D10S1158   115937134   115937433   DG10S 1636   115966165   115966382   DG10S540   115983225   115983471   DG10S1637   116025219   116025491   DG10S542   116054130   116054255   DG10S1638   116062921   116063264   D10S1776   116140681   116140897   DG10S546   116141340   116141590   DG10S547   116173634   116173887   DG10S1639   116184720   116184898   DG10S548   116202775   116203174   DG10S550   116288175   116288560   D10S562   116304948   116305132   DG10S1640   116344030   116344279   DG10S1641   116638155   116638540   DG10S566   116866173   116866431   D10S468   116869582   116869674   DG10S567   116904174   116904433

  D10S1731   117001692   117001870   DG10S573   117070087   117070192   DG10S576   117153566   117153823   DG10S578   117196538   117196813   DG10S1644   117206992   117207391   DG10S579   117226056   117226234   DG10S580   117240674   117240858   DG10S584   117336471   117336821   DG10S585   117364742   117364845   DG10S586   117385650   117385816   DG10S589   117481892   117482165   DG10S590   117508690   117508966   DG10S591   117520912   117521057   DG10S593   117567541   117567800   D10S1748   117589638   117589885   DG10S596   117629981   117630119   DG10S597   117654759   117654928   DG10S523   117691905   117692329   DG10S598   117691905   117692156   D10S1773   117708786   117708989   DG10S599   117713714   117714115   DG10S524   117713997   117714115   DG10S600   117742602   117743019   DG10S525   117742701   117742986   DG10S1250   117861226   117861405   DG10S604   117867801   117868010   DG10S1293   117932494   117932721   DG10S1144   117950298   117950606   DG10S609   118014503   118014752   DG10S610   118041410   118041787   DG10S1252   118085912   118086081   DG10S612   118092869   118093247   DG10S613   118126058   118126312   DG10S614   118150018   118150178   D10S544   118164684   118164979   D10S1683   118211053   118211180   D10S1657   118287426   118287695

  D10S545   118299618   118299851   DG10S1649   118306954   118307121   D10S187   118317655   118317730   DG10S1295   118375973   118376205   DG10S624   118401694   118402073   DG10S1203   118440472   118440835   DG10S627   118514695   118515072   DG10S1650   118521021   118521210   DG10S1681   118522946   118523333   DG10S628   118553693   118553836   DG10S634   118566844   118567191   DG10S639   118712208   118712596   DG10S640   118743450   118743821   D10S221   118766458   118766560   DG10S1686   118766464   118766561   DG10S641   118788135   118788401   DG10S1651   118794961   118795267   DG10S1255   118834290   118834438   DG10S644   118857362   118857745   DG10S1652   118862172   118862311   DG10S1654   118954536   118954869   DG10S1688   118972583   118972717   DG10S1689   118987319   118987480   DG10S1690   119004704   119004986   D1081425   119004742   119004920   DG10S651   119030166   119030595   DG10S1655   119044005   119044188   DG10S1691   119078576   119078943   DG10S1207   119094382   119094722   D10S1693   119109493   119109731   DG10S1258   119131611   119131788   DG10S656   119177278   119177672   DG10S1694   119177430   119177614   DG10S1695   119204432   119204655   DG10S657   119204769   119205174   DG10S658   119223917   119224102   DG10S1696   119243071   119243408

  DG10S1657   119282299   119282586   DG10S1658   119290241   119290632   DG10S661   119305067   119305226   DG10S662   119317406   119317660   DG10S663   119330718   119331131   DG10S1699   119364904   119365188   DG10S665   119396863   119397144   DG10S1659   119412611   119412992   DG10S667   119448478   119448736   DG10S1701   119473676   119473914   D10S1236   119473739   119473870   DG10S669   119485378   119485552   DG10S670   119505799   119505905   D10S190   119510348   119510554   DG10S1702   119510362   119510479   DG10S1153   119526060   119526329   DG10S673   119606691   119606963   DG10S1305   119615268   119615484   DG10S675   119659153   119659532   DG10S1661   119663175   119663453   DG1OS1662   119700563   119700948   DG10S1306   119703996   119704204   DG10S1663   119783538   119783739   DG10S1704   119783569   119783694   DG10S631   119788517   119788678   D10S1148   119803465   119803663   D10S1150   119803465   119803662   D10S503   119803476   119803653   DG10S632   119811193   119811621   DG10S681   119811347   119811621   DG10S633   119833701   119833987   D10S2473   119833724   119833869   DG10S682   119838539   119838806   DG10S683   119853558   119853862   DG10S684   119880412   119880572   DG10S685   119909682   119910062   DG10S686   119923527   119923790

  DG10S687   119954835   119955083   DG10S1212   119972358   119972707   DG10S1261   119995566   119995727   DG10S1350   120004924   120005036   DG10S1   120030830   120031131   DG10S693   120100794   120101005   DG10S1263   120132349   120132528   D10S542   120417003   120417230   DG10S1664   120444685   120444808   DG10S1163   120506796   120507066   DG10S703   120538236   120538484   DG10S704   120570334   120570593   DG10S706   120642052   120642312   DG10S708   120699520   120699811   DG10S709   120723780   120724158   D10S1701   120849161   120849428   DG10S716   120893782   120894153   DG10S1669   120969521   120969659   DG10S720   121016792   121017048   D10S1792   121042408   121042574   DG10S722   121070320   121070693   DG10S1181   121101362   121101685   DG10S724   121117025   121117286   DG10S1670   121162511   121162898   DG10S726   121217327   121217580   DG10S1167   121247552   121247838   DG10S729   121283257   121283429   DG10S730   121318865   121319131   DG10S731   121342622   121342893   DG10S1278   121384227   121384464   DG10S734   121425229   121425633   DG10S735   121446549   121446695   DG10S1185   121466936   121467248   DG10S1129   121472295   121472600   DG10S1085   121494260   121494657   DG10S1327   121526700   121526830   DG10S1271   121559895   121560066

  DG10S741   121638254   121638391   DG10S1087   121647884   121648273   DG10S1359   121713760   121713892   DG10S1120   121726128   121726519   DG10S1671   121750886   121750993   DG10S1673   121823695   121823925   DG10S749   121841816   121841997   DG10S1134   121901381   121901668   DG10S1674   121931406   121931809   DG10S755   121976143   121976435   D10S1757   121989325   121989539   D10S209   121995173   121995376   DG10S757   122029990   122030248   DG10S1283   122045222   122045429   DG10S1191   122071761   122072115   DG10S761   122141102   122141322   DG10S1678   122146312   122146535   DG10S762   122167889   122168135   DG10S763   122185793   122185925   DG10S1284   122207287   122207508   DG10S1137   122220809   122221073   DG10S766   122257534   122257929   DG10S767   122283871   122284250   DG10S1361   122318975   122319081   DG10S1680   122390160   122390294   D10S1230   122407279   122407403   DG10S772   122421708   122421845   DG10S775   122463781   122463941   DG10S777   122524358   122524547   DG10S779   122580228   122580603   DG10S784   122719087   122719236   D10S1483   122948181   122948324   D10S587   124728937   124729112

鉴定与DG10S478相关的微卫星标记物的单一标记物关联分析(表 2和图1)。

表2:在冰岛DG10S478与II型糖尿病的关联

  等位基因   患病组频率   (n=1185)   对照组频率   (n=931)   RR[95%Cl]   两侧P   0   0.636   0.724   0   2.1×10-9  4   0.005   0.002   2.36   0.12   8   0.093   0.078   1.21   0.090   12   0.242   0.178   1.48   4.6×10-7  16   0.022   0.015   1.53   0.076   20   0.001   0.003   0.39   0.17   X   0.364   0.276   1.50[1.31,1.71]   2.1×10-9

6个等位基因中观察到这种四核苷酸重复,等位基因0,8和12 占人群对照中染色体的98%。相对于其他组合的等位基因,等位基因0 显示保护性关联(相对危险度(RR)=0.67;P=2.1×10-9)。这个P-值是 两侧的,考虑了一些患者彼此具有亲缘关系。DG10S478位于10q25.2 上转录因子7-样2(TCF7L2-原先的TCF4)基因的内含子3中。这个 标记物在明确定义的74.9kb LD块内(基于CEPH白种人HapMap Phase II),包含内含子3的一部分、外显子4的全部和内含子4的一部分(图 1)。

当在CEPH白种人HapMap家族DG10S478被基因分型时,清楚 的观察到SNP rs12255372的等位基因G与DG10S478的等位基因0几 乎完全相关(r2=0.95,P=5.53×10-38),rs12255372的等位基因T与 DG10S478的其他等位基因相关。此外,DG10S478的等位基因8和12 造成的风险一致(P=0.3)。因此很自然将DG10S478的所有非0等位 基因合并成一个复合等位基因,称为等位基因X。等位基因X在对照和 患者中的频率分别是27.6%和36.4%。采用乘法模型(16,17),相对 非携带者的风险,带有的每拷贝的等位基因X预测RR为1.50。

与II型糖尿病关联的DG10S478的重复

为了验证DG10S478与II型糖尿病的关联,在228个病例的丹麦 II型糖尿病群组和539个对照中对微卫星进行基因分型。丹麦群组选自 丹麦的PERF(Prospective Epidemiological Risk Factors,预期流行病学 危险因素)研究(19)。这个女性II型糖尿病群组先前已经确诊患有 II型糖尿病。冰岛观察到的关联被重复(表3)。

表3:在丹麦DG10S478与II型糖尿病的关联

  等位基因   患病组频率   (n=228)   对照组频率   (n=539)   RR[95%Cl]   两侧P   0   0.669   0.740   0.71   0.0048   4   0.002   0.004   0.59   0.62   8   0.070   0.048   1.49   0.091   12   0.239   0.190   1.34   0.032   16   0.020   0.018   1.12   0.78   X   0.331   0.260   1.41[1.11,1.79]   0.0048

复合风险等位基因X在对照中频率为26.0%,在II型糖尿病中为 33.1%,得到的估计RR为1.41(P=0.0048)。

随后,在PENN CATH研究的包括美国白种人361个II型糖尿病 群组病例和530个对照的中对微卫星进行基因分型。这项研究是在宾 夕法尼亚大学医疗中心(University of Pennsylvania Medical Center)接 受心导管插入术的患者连续群组中进行的生化和遗传因素与冠状动脉 粥样硬化关联性的横断研究。II型糖尿病定义为具有以下病史,空腹血 糖>126mg/dl,餐后2小时血糖>200mg/dl,40岁以上个体中使用口服 降血糖药或者胰岛素。在冰岛人中观察到的关联在这个种群中也被重 复(表4)。

表4:在美国DG10S478与II型糖尿病的关联

  等位基因   患病组频率   (n=361)   对照组频率   (n=530)   RR[95%Cl]   两侧P   -4   0.001   0.000   -   -   0   0.615   0.747   0.54   3.3×10-9  4   0.003   0.004   0.73   0.72   8   0.085   0.049   1.79   0.0029   12   0.256   0.180   1.57   1.2×10-4  16   0.040   0.020   2.07   0.012   X   0.385   0.253   1.85[1.51,2.27]   3.3×10-9

复合风险等位基因X在对照中频率为25.3%,在II型糖尿病中为 38.5%,得到的估计RR为1.85(P=3.3×10-9)。利用Mantel-Haneszel 模型(NOTE 3),从全部3个群组得到的组合得到总的两侧P是4.7 ×10-18

3个种群中复合风险等位基因与II型糖尿病的关联构成强有力证 据,表明TCF7L2基因变异体增加患II型糖尿病风险。

在毫无疑问的建立等位基因X与II型糖尿病的关联之后,我们更 细致的研究了遗传方式。显性模型和隐性模型可以被拒绝,因为杂合 体携带者相对非携带者风险显著升高(P<1×10-6),相对纯合子携带 者风险显著降低(P<0.0001)。乘法模型提供更好拟合,但有证据说明 纯合子携带者相对杂合体携带者的风险大于杂合体携带者相对于非携 带者的风险。表5提供杂合体携带者和纯合子携带者相对非携带者的 相对危险度的无模型估算。

表5:相对危险度的无模型估算

3个群组对风险等位基因具有相似的种群频率,但RR估值不同; 美国群组中效应最强,丹麦群组中效应最弱。尽管在群组中RR相同是 没有理由的,应当注意估算相对危险度的差异不需要没达到统计显著 性(P>0.05)。对采用常用相对危险度从群组得到的结果进行组合,, 杂合体携带者和纯合子携带者相对非携带者的相对危险度据估算分别 为1.45和2.41(表5)。假设风险等位基因的种群频率是26%,则杂 合体和纯合子的携带者分别占种群的38%和7%。因此,这种变异体对 于临床使用具有良好的预测价值。对应种群归属风险是21%,这从公 共卫生观点来看是实质性的。

还应注意到等位基因X在空腹血糖受损(IFG)个体(空腹血糖 在6.1和6.9mM之间)中过量。复合风险等位基因X在1393个对照中 频率为27.7%,在278个IFG病例中为37.1%,得到估算的RR为1.54 (P=1.36×10-5)。

TCF7L2外显子4LD块内SNP标记物与II型糖尿病的关联

我们在表6中列出位于TCF7L2外显子4LD块内的微卫星和SNP 标记物。该表包括公布的SNPs,以及通过对整个LD块区域测序发现 的SNPs。该表还提供位于所述块内的多态性微卫星标记物。

表6.位于TCF7L2外显子4LD块内的多态性标记物(在标记物 rs4074720和rs7087006之间,定位在Build 34坐标:rs4074720(B34: 114413084)-rs7087006(B34:114488013)=74929bp。对序列识别索引进 行合适的标记,涉及各种情况下包括多态性的扩增引物和正反向引物 的SEQ ID号,如序列表所示。

A公共SNPs(包括全部HapMap种族)

  公共名称   染色体10 B34   定位   碱基变化   序列ID NO:   rs4074720   114413084   A/G   rs4074719   114413145   C/T   rs4074718   114413204   C/T   rs11196181   114413605   A/G   rs11196182   114414744   C/T   rs4603236   114414765   G/T   rs7922298   114414856   C/T   rs17747324   114417090   C/T   rs7901695   114418675   C/T   17-19   rs11196185   114420079   C/T   rs4132115   114420083   A/C   rs4506565   114420628   A/T   14-16   rs7068741   114420845   C/T   rs7069007   114420872   C/G   rs7903146   114422936   C/T   11-13   rs11196187   114424032   A/G   rs7092484   114425520   A/G   rs10885402   114426284   A/C   rs12098651   114426306   A/G   rs6585198   114426824   A/G   rs7910244   114427209   C/G   s12266632   114429546   C/G

  rs6585199   114429758   A/G   rs7896811   114431304   C/T   rs6585200   114433196   A/G   rs6585201   114433370   A/G   rs4319449   114433993   G/T   rs12220336   114434854   A/G   rs7896091   114436550   A/G   rs12354626   114437016   A/G   rs7075199   114437307   C/G   rs7904519   114438514   A/G   rs13376896   114441336   A/C   rs10885405   114442257   C/T   rs108854O6   114442311   A/G   rs11196192   114446874   G/T   rs6585202   114447390   C/T   rs7924080   114451599   C/T   rs7907610   114451677   A/G   rs12262948   114452313   C/G   rs12243326   114453402   C/T   8-10   rs12265110   114453606   C/T   rs7077039   114453664   C/T   rs11196198   114456472   A/G   rs12775336   114459590   G/T   rs7904948   114459672   A/T   rs7100927   114460635   A/G   rs11196199   114460704   A/G   rs17685538   114462058   C/G   rs11592706   114463573   C/T   rs7081912   114463678   A/G

  rs7895340   114466112   A/G   23-25   rs11196200   114466525   C/G   rs11196201   114467894   A/T   rs11196202   114470254   A/G   rs11196203   114470447   A/C   rs11196204   114470518   A/G   rs11196205   114471634   C/G   20-22   rs10885409   114472659   C/T   rs12255372   114473489   G/T   5-7   rs12265291   114474827   C/T   rs7904443   114475774   A/G   rs11196208   114475903   C/T   rs7077247   114476658   C/T   rs11196209   114477314   A/G   rs4077527   114477628   A/G   rs12718338   114477634   C/T   rs11196210   114478558   C/T   rs7907632   114481823   A/G   rs7071302   114482114   G/T   rs12245680   114484778   C/T   rs11196213   114486141   C/T   rs4918789   114486394   G/T   rs7085785   114487050   C/T   rs7085989   114487326   A/G   rs7087006   114488013   A/G

B.发现的新SNPs,随后在TCF7L2外显子4LD块内验证(扩增 引物如下):

  deCODE名称   染色体10B34   定位   碱基变化   序列ID NO:   SG10S405   114418658   C/T   26-28   SG10S428   114421901   A/C   29-31   SG10S422   114457824   A/G   32-34   SG10S427   114463480   A/T   35-37   SG10S408   114466074   A/T   38-40   SG10S409   114471574   A/C   41-43   SG10S406   114471618   C/G   42-44   SG10S407   114473534   C/G   45-47

C.TCF7L2外显子4LD块内的多态性微卫星(扩增引物如下):

  微卫星   C10B34起始   C10B34终止  序列ID NO:   DG10S2164   114460344   114460627  48-50   DG10S478   114460845   114461228  2-4   DG10S479   114475487   114475632  51-53

表7.TCF7L2外显子4LD块内选择性标记物的扩增引物和引物

>DG10S478

TTCAGGCCATTGGTGTTGTATATATTTCAAGATTTGCTCACAGGTCCAAAGCT

TAACTTAAGCTCCCTGAGACATATCATAAAATATGATTTGGGGAAAAACCCT

AATGGGCCATGATCAGAACATTATTATTCAACAAAGGATGAAATGCTTAAGC

CAAGATGGCCTTCTTTCTTTCTTTCTTTCTTTCTTTTTTTTTAATGAAAGTTGA

GCAGACTCCCGTCCAACAGTTTTCAATGTAGGAATTCCCACAGCCCCATTTG

ATTGCAGTTTGTTGAAAAGTTTAATGTTTTTGTAGGCAATTCATAATTTCCAC

ATTGAACAGCCTGAGAGGAAGAGAGCTGGAGCCCACTGTTGTTTTTGTAGTG

GGATGGTGGGAACTTT(SEQ ID NO:2)

引物:

F:TTCAGGCCATTGGTGTTGTA(SEQ ID NO:3)

R:AAAGTTCCCACCATCCCACT(SEQ ID NO:4)

>rs12255372

TTGTCCCTTGAGGTGTACTGGAAACTAAGGCGTGAGGGACTCATAGGGGT

CTGGCTTGGAAAGTGTATTGCTATGTCCAGTTTACACATAAGGATGTGCA

AATCCAGCAGGTTAGCTGAGCTGCCCAGGAATATCCAGGCAAGAAT

K

ACCATATTCTGATAATTACTCAGGCCTCTGCCTCATCTCCGCTGCCCCCC

CGCCCCCTGACTCTCTTCTGAGTGCCAGATTCAGCCTCCATTTGAATGCCAA

ATAGACAGGAAATTAGCATGCCCAGAATCCACGTCTTTAGTGCACTCT

TCCCCAGCTCCAAACCTGTTACTGCTTGTGTTCAACATCTCAGTAAAGCTCA

ACAACATCGACCCATT(SEQ ID NO:5)

引物:

F:TTGTCCCTTGAGGTGTACTGG(SEQ ID NO:6)

R:AATGGGTCGATGTTGTTGAG(SEQ ID NO:7)

>rs12243326

GCTGTGAAATCCCCTGTGTAGTGGGAAGAAGAAATAGCAAATCTTAGCTGC

CTTGGACCTGATATAATTATTTGTCTTCATTTACATGGTT

Y

ATCCTTCAAGGTTGAATAAATGATGTGGGAGCTAGTCAAGGGGCTTTAGGTA

TGTGATTTCATGCCTACTTTTTTTTAGGTAGAGAAACTGAGGTCACAGGGTA

CTAGAGAATGGACTCTAAGATTCAGGTTTCTGAATTGCCTGTGGTTTTGTTG

ACTCAACTGCTCTTCTGTTGTTTTTTAGCCACATGCCTTGAAACAGTCCTCTT

TCCCATGTTTCTTCATCAGCACCATTAACCCAAGGTATACTGTCCTCTCTTAT

CTTTCACAAGGTCTTGGAGTTCCCATGCCTTTGTAAGCATCCCTCCCCGAGAT

TCAGCACCAACCAAAATCACATTTGGAAAAATTGCTTGTTTCCCAAGAAGCT

TTGGAGGATATGATTTTGTATAGAACGGGTTCACAGGTTTTCTGTTCATTCTT

CTATGGTGGAGTGTGTGTGTATGTGACTCTGTCTTCTCTCCATTCC(SEQ ID

NO:8)

引物:

F:GCTGTGAAATCCCCTGTGTAG(SEQ ID NO:9)

R:GGAATGGAGAGAAGACAGAGTCA(SEQ ID NO:10)

>rs7903146

AAGGGAGAAAGCAGGATTGAGCAGGGGGAGCCGTCAGATGGTAATGCAGA

TGTGATGAGATCTCTGCCGGACCAAAGAGAAGATTCCTTTTTAAATGGTGAC

AAATTCATGGGCTTTCTCTGCCTCAAAACCTAGCACAGCTGTTATTTACTGA

ACAATTAGAGAGCTAAGCACTTTTTAGATA

Y

TATATAATTTAATTGCCGTATGAGGCACCCTTAGTTTTCAGACGAGAAACCA

CAGTTACAGGGAAGGCAAGTAACTTAGTCAATGTCAGATAACTAGGAAAAG

GTTAGAGGGGCCCTGGACACAGGCCTGTGTGACTGAGAAGCTTGGGCACTTC

ACTGCTACATTTCATCTCTTCGCT(SEQ ID NO:11)

引物:

F:AAGGGAGAAAGCAGGATTGA(SEQID NO:12)

R:AGCGAAGAGATGAAATGTAGCA(SEQ ID NO:13)

>rs4506565

CTGATGAGGGTAGGGAGCATCTGTCTGCAGCTTCATCTTCATTGTCTAGGGG

CTCCAGAAATATCTGTGAGTAAATAAGTTATTTAATCTTTGCCTCAAATTTCC

AGTGACTGTAGGGATATAGCTGTGAGCCTCTAGGAGCTGAGATTTTTTAAAT

TTCCCACTTAAACATTTATTTAAAAATTTTGTGCTCAGCATGG

ACTAAGGACTTTACATTCATTAACTCATTTACAGCTTGATCCTATGCGGT

GGGCATTCATTTACAGAGGATCCCATTTTACAGGTGAGGAAGAGGCCAGC

TAGGGGTGCAGCCTAGGTTAGTATTCTAGAGCTCATCAGGCTGTGTTGTC

XCAGTGAAAGAATAAGCAAAGAAGTGAATGTTGTGCATTGAGAAAAATG

ACTCTCGGAGGAGGATGAGCCTCTCGGATATGGCGACCGAAGTGAT

W

TGGGGCCCTTGTCAAGGGTCTCTATTATGGCATCAAGAAAAGATGCTGCT

TTCGGTGATGCCCGAGGAGAGCCTCAATATTTTACATGGGAAACCTAAAA

AAGGGGCCATGTTGTGGTCTCTGCACCTAAGA(SEQ ID NO:14)

引物:

F:CTGATGAGGGTAGGGAGCA(SEQ ID NO:15)

R:TCTTAGGTGCAGAGACCACAAC(SEQ ID NO:16)

>rs7901695

TATTTAGAAACCATAAAATCCACCTATTTGAGGTGTACAATTGAGTGATTTT

CTGTATAGTCACAGATCTGTGCAGTCATCCACACCCTCTAACTCCAGGACAT

TTTCCTCACCCCCGAGGAGAAACCTCCCTTACCCATTAGCAGTCACTCCTCAT

TTCCTCTCCCCCCAGCCCCTGGCAATCACTGTGGATTTGCCTGTTCTTGACAT

TTCATATAAATGGTATCATAAAATCTA

Y

GGGCTTTTGTGTCTGTCTGCTTTCACTTAGCATACGGTTCTCAAGGTTCATCC

AGTATTGTAGCATCTATCAGTATGTCATTCCTTTTTATGGCCAAATAATATTT

TATTGTATGGATAGACATTTTGTTTATTCATTTATCTGTTTTTGGTTATTATGA

GTAACACTACTATGAACATTTTGCACAAATTTTTGTATTGACATGTTTTCATT

TCTCCTGGGTATAGTCCTATGAGTGGAATTGCTGG(SEQ ID NO:17)

引物:

F:TATTTAGAAACCATAAAATCCACCTAT(SEQ ID NO:18)

R:CCAGCAATTCCACTCATAGGAC(SEQ ID NO:19)

>rs11196205

TTGTCTCCTTTTGTTTCTGCTACTGTGAATGATCCTGTGATGATCATCTTTGTG

TGTAAATCTTTGTCCCCTCGCCCCCTCCCCTTTTATTATTTTCTTGGGATAGA

CCCCAGGACAAAAGGTAGAAAAGAACAAAGTGTTAAAAAATTTCTTGATAC

ATAGCCACAGATTATTTTCCTGAAAGTTCTCAACATTTATAACTAC

S

AGCAGTATGTAAGAGAGTTATGGTTGGAATGATTTTAATGTCTCTGGGGAAT

TTAACAACAAAAAAACTTTAGGCTTCTTTGGAGAGAGACATGCCCTTA

ACTCCACCCCGCCCTAGAACAGAGACCCAGCCCATCCAAGTCAGCCTCCC

CAGGTCCTCCACCTTCAAAACAGGCAAACGAAATCATTTCTTGAATAATT

GGTAGGCTTCAAGGTCAGATGTT(SEQ ID NO:20)

引物:

F:TTGTCTCCTTTTGTTTCTGCTAC(SEQ ID NO:21)

R:AACATCTGACCTTGAAGCCTAC(SEQ ID NO:22)

>rs7895340

TCAGGGACAGTGCATAGGTGTAAAGAAGTTGCTGGTTGGGGGTTCTAATGC

AGGTTTCTCCAAAAGTGAATGCCCTGTTAAAAAAAAATTCTTAACAAATATA

CAGAGATTTTTTTTTTAAAAAAGTGTGACAGTTCTAGACACCTAGAGAGTAA

A

R

TGAAGAAGCCTGTTTTCAGGTTTCCCGCCTCCCTGAATTTCCCAGCATGGTCC

AGGCTTTGAAATTTATTTATCTGCTTTTGGCAATGGTTGATGGGAATTTCCCA

CATTTATTTTTTAGCTACAGAGAAAGGACATTATCTTTAAAATCTCTTCGTTG

TTCTCTCTCTTTGA(SEQ ID NO:23)

引物:

F:TCAGGGACAGTGCATAGGTG(SEQ ID NO:24)

R:TCAAAGAGAGAGAACAACGAAGA(SEQ ID NO:25)

>SG10S405

TATTTAGAAACCATAAAATCCACCTATTTGAGGTGTACAATTGAGTGATTTT

CTGTATAGTCACAGATCTGTGCAGTCATCCACACCCTCTAACTCCAGGACAT

TTTCCTCACCCCCGAGGAGAAACCTCCCTTACCCATTAGCAGTCACTCCTCAT

TTCCTCTCCCCCCAGCCCCTGGCAATCACTGTGGATTTGCCTGTTCTTGACAT

TTCATATAAA

Y

GGTATCATAAAATCTATGGGCTTTTGTGTCTGTCTGCTTTCACTTAGCATACG

GTTCTCAAGGTTCATCCAGTATTGTAGCATCTATCAGTATGTCATTCCTTTTT

ATGGCCAAATAATATTTTATTGTATGGATAGACATTTTGTTTATTCATTTATC

TGTTTTTGGTTATTATGAGTAACACTACTATGAACATTTTGCACAAATTTTTG

TATTGACATGTTTTCATTTCTCCTGGGTATAGTCCTATGAGTGGAATTGCTGG

GTCATATAATAAATAACTGTTTAACATTTTGGGGAGCTGCCAAACTTTTAAA

ACCTTGGGTTCTGTGATGTACCAGTTGTGTTAGGCA(SEQ ID NO:26)

引物:

F:TATTTAGAAACCATAAAATCCACCTAT(SEQ ID NO:27)

R:TGCCTAACACAACTGGTACATC(SEQ IDNO:28)

>SG10S428

TGCCAGGGGTTTTATGGTTAATTTTCCTCCATTATGAGGGTTGACTCAGCCTT

GGGTATTAGATGTCTTTGAGAATCCAGGGTTCAAATACCACAGCTGGTAGAA

TGTTTCTCAACTTGGAGCCAATCTCCATCTACTGAAGGTACGCTGGTTTAGA

CAGACAACAGGGACATCAGCATTTTAAAAAGCGGTGGAAAAAGTTTGCTTG

TCTTGATTGGAGCCATGACATTTTATTTTGAAATTTCAAATAACATGAAGGG

AGGTTTGGAGCGGTTTTTGGTTTATCCAAAGGGCAGTGGATTGAAGGCTGAG

AAACACCAGGCTGAATGGGAGAGGGGTTGGGGTCCCCCTGTGAGATAGTGA

AACAATGGTAGTGCCATCCAATGATAGGCACTTTTCTGTCATTCAGAAGCAG

AAAGGGGGCCAGAGGCCCATTGGCCTTACTGGG

M

AGTAAGCTGTAGAGCTGCTGCCTTTTCGTGAAAGGGTTGACACCAACCTTCT

CCCCCAGGAAGAGTGACCAGGGACCTGAGGGGCATGGTCGAGCAGATGACA

GCCTTTGTAAAACATCTCC(SEQ ID NO:29)

引物:

F:TGCCAGGGGTTTTATGGTTA(SEQ ID NO:30)

R:GGAGATGTTTTACAAAGGCTGTC(SEQ ID NO:31)

>SG10S422

TTGGTAGAGATGGGGTCTCCTAGGCTGGTCTTGAACTCCTGG

R

CTCAAGCAATCTTCCTGCCTCAGCCTTCCAAAGTACTGGGATTACTGGCGTG

GGCCACCATGCCTGGCTTGAAATTTTTCTATGGCTTTATTCTTTCTCCAAGTA

CAGAGTCTACCCAACCTTCTGAGATCTTTGGTTTTCTTTTCCTAGGTAACTAT

AGTACATACTTATTTATGTTAAACAACAGCAATCACACATTTCTTTTTCTATA

CAGTCATGCTTTATAGGCAAATAAAGCCTCCGTCTTAGGCTTTCTGGATTTTT

TCAAAAGATGCAATTCCTGGAGTATGTTTTTACTTAGAGCAAAGCAGCCTAG

TCTCCTATACCTTCTGCATCTGCAGAAAAGTTGGTTAAACAGACTTTGTAAT

GATGCCCCTTACAATTCTGAAGGGACTTGTGAAATAGTTTCACAGAGTTTCA

GTGTTAGGTATATTTGATCAATGCTAACTTTTGGAAAACTTTGGTGCCTGTAT

GATTCAGAGGGTAGGGCAGAATATTAA

ATTAATCACAACTTCTTGTATTTTAACCATTCTGGGTAAATTGGGATTCC

GTGACGCCCAGGCAAAATTAT(SEQ ID NO:32)

引物:

F:TTGGTAGAGATGGGGTCTCC(SEQ ID NO:33)

R:ATAATTTTGCCTGGGCGTCA(SEQ ID NO:34)

>SG10S427

TATCTTATATCCCCTCCAAGCATTCATTAACTGATGGATTAGTGAGTTGG

XTTGAGAAGCATAAAGGCTCGTCTCCATGTGCTTCTAAGCATTGTGTCT

AAGTTCTGTTTGGTTTCCTGAGTGAAACTGTCTTAATGTTACCAACAGAAGTT

AAATGCCTAAGAG

W

TTCTTATACATGGGCTGAGTACCTCTGTGACTGGGCAAGCCACCTCACCTCA

TTTTACCTTGTCTGCAAAATGAGGAACTGGGTCAACTCATCGTTCAAATCTC

ACTGAAAGCTAATTGATCGCTTTTGACAGAAGTAGCTCCCTTGGGCCGTATA

TTTATTTCCTAGCTTGGAGGAAGGTGGGGACAGACAGAATTGATGTACACCT

TTATTTTTATCTCTATGGTAAACCTGTGCATACTAAAGCATTCCTCTGGTCTT

TTGAGATGAGTGTATACATTGTGTCTGGCCCTGTGCATTTTTTACCAAGAAGT

AAGTTTTGTTGAGTAAACTTGGGTTGTATGAAGAACTGCATGCTCACCGTAC

TCAAGTAGCTTTTGCTACCTAAAGGACAGCTGCTCATATGTACTTGACTTCCT

TTAAAGTGAAGGATGATGACATTTGAAAAACGGAGGTTGAAAAGGAG(SEQ

ID NO:35)

引物:

F:TATCTTATATCCCCTCCAAGCATTC(SEQ ID NO:36)

R:CTCCTTTTCAACCTCCGTTTT(SEQ ID NO:37)

>SG10S408

TTGAGCATGTGTTATTTAATGAGTTATACCTCTGTCATATGTGTGTGTTTATA

TCACAAAATAACTTATTTTTATAAAACCATATTTTGAGTCATCATTTGTGACA

ATGTCTTCTTTTCTCTGGTATAAATGAGGCATGTAGAAAGAAGATTGACATT

TGCTAGAAGCTTCCCCTTTCCTCTAACTCCACAATAAAATGGATGCTCATAA

TTACATCTGCTCCTATAAGGTCAAGATTTCAGGGCTGGAAGTGACCTTAGAT

CATTTAGGCCCAACTTGCCCTCAGGAAAGGAAACTGAGGCCCAGAGATGCC

TTAAGTGAATTGCCCAATGTCACACGCTGAGTCAGTGGCCAGAGCAAGGCTT

GGATCCAGTTCTCTGCTCCCTTTCCAGAGCCTTGTGATGTCTTCTCTCCTACA

GGAGGTGAAAATAACTGCTGTGGCTGGTTCTGTTTTGCTGACTGTAAATTGG

GTCATGGTCAGGGACAGTGCATAGGTGTAAAGAAGTTGCTGGTTGGGGGTTC

TAATGCAGGTTTCTCCAAAAGTGAATGCCCTGTTAAAAAAAAATTCTTAACA

AATATACAGAGATTTTTTTTT

W

AAAAAAGTGTGACAGTTCTAGACACCTAGAGAGTAAAGTGAAGAAGCCTGT

TTTCAGGTTTCCCGCCTCCCTGAATTTCCCAGCATGGTCCAGGCTTTGAAATT

TATTTATCTGCTTTTGGCAATGGTTGATGGGAATTTCCCACATTTATTTTTTA

GCTACAGAGAAAGGACATTATCTTTAAAATCTCTTCGTTGTTCTCTCTCTTTG

AGTGAGGAGAGAAGATGTGAATCCTGGCAGTGGTTCAGAGTGGACACAGCC

CCTGTGTTTGTGGCATAGGCTCTGTGGGCCCCATGCCAGGGAGCAGTACCCC

CGTGTAAAGGAGTGGGGGTTTGTCCATTTGGATAGAGCAAAGATCCTCCACC

TCAAATCCCACAAGAACAGTTGCCACAACCTGGGCCCTAAGCATCTCATTTT

CCTATGTAGAAATTAATGATCTGGAGGAGATGGCAAAACATTCCTTCCAGAG

CCTGTGTGGATTTTGG(SEQ ID NO:38)

引物:

F:TTGAGCATGTGTTATTTAATGAGTTA(SEQ ID NO:39)

R:CCAAAATCCACACAGGCTCT(SEQ ID NO:40)

>SG10S409

TAGTGCTCAGTATTTCCAACGTTCTGTTTATTTAAGATGAAAATTGCTGT

AGTTAATAAGCACTTCCCCATGTCATTAAAATGCTTAAGGATTTTTAATG

ACCACATAACAGTCCATAATATGATTAAACCCCAATTTACTGAATCAATG

ICATATTGTTGGGTCTTTAGATTGTCTCCTTTTGTTTCTGCTACTGTGAA

TGATCCTGTGATGATCATCTTTGTGTGTAAATCTTTGTCCCCTCGCCCCC

TCCCCTTTTATTATTTTCTTGGGATAGACCCCAGGACAAAAGGTAGAAAAGA

ACAAAGTGTTAAA

M

AATTTCTTGATACATAGCCACAGATTATTTTCCTGAAAGTTCTCAACATTTAT

AACTACGAGCAGTATGTAAGAGAGTTATGGTTGGAATGATTTTAATGTCTCT

GGGGAATTTAACAACAAAAAAACTTTAGGCTTCTTTGGAGAGAGA

CATGCCCTTAACTCCACCCCGCCCTAGAACAGAGACCCAGCCCATCCAAG

TCAGCCTCCCCAGGTCCTCCACCTTCAAAACAGGCAAACGAAATCATTTC

TTGAATAATTGGTAGGCTTCAAGGTCAGATGTT(SEQ ID NO:41)

引物:

F:TAGTGCTCAGTATTTCCAACGTTCT(SEQID NO:42)

R:AACATCTGACCTTGAAGCCTACC(SEQ IDNO:43)

>SG10S406

TAGTGCTCAGTATTTCCAACGTTCTGTTTATTTAAGATGAAAATTGCTGT

AGTTAATAAGCACTTCCCCATGTCATTAAAATGCTTAAGGATTTTTAATG

ACCACATAACAGTCCATAATATGATTAAACCCCAATTTACTGAATCAATGCC

ATATTGTTGGGTCTTTAGATTGTCTCCTTTTGTTTCTGCTACTGTGAATGATCC

TGTGATGATCATCTTTGTGTGTAAATCTTTGTCCCCTCGCCCCCTCCCCTTTT

ATTATTTTCTTGGGATAGACCCCAGGACAAAAGGTAGAAAAGAACAAAGTG

TTAAAAAATTTCTTGATACATAGCCACAGATTATTTTCCTGAAAGTTCT

S

AACATTTATAACTACGAGCAGTATGTAAGAGAGTTATGGTTGGAATGATTTT

AATGTCTCTGGGGAATTTAACAACAAAAAAACTTTAGGCTTCTTTGGAGAGA

GACATGCCCTTAACTCCACCCCGCCCTAGAACAGAGACCCAGCCCATCCAAG

TCAGCCTCCCCAGGTCCTCCACCTTCAAAACAGGCAAACGAAATCATTTCTT

GAATAATTGGTAGGCTTCAAGGTCAGATGTT(SEQ ID NO:44)

引物:

F:TAGTGCTCAGTATTTCCAACGTTCT(SEQID NO:42)

R:AACATCTGACCTTGAAGCCTACC(SEQ ID NO:43)

>SG10S407

TGCTATGTCCAGTTTACACATAAGGATGTGCAAATCCAGCAGGTTAGCTGAG

CTGCCCAGGAATATCCAGGCAAGAATGACCATATTCTGATAATTACTCAGGC

CTCTGCCTCATCTCCGCTG

S

CCCCCCGCCCCCTGACTCTCTTCTGAGTGCCAGATTCAGCCTCCATTTGAATG

CCAAATAGACAGGAAATTAGCATGCCCAGAATCCACGTCTTTAGTGCACTCT

CTCCCCAGCTCCAAACCTGTTACTGCTTGTGTTCAACATCTCAGTAAAGCTCA

ACAACATCGACCCATTACTTAGGCCTCAAACCTTGGGTGGCATCGTCGATTG

CTCTTTTCTTTCATACCCCACATTCAACCCATCAGCCCATCCCACAGGCCCAA

GTGTGTCCTCTCTACCTTCAAAGCGTGTGTGGCATCCACCGCTTATCACCACC

TCTGCCATTACCACTGGAGTCCAGTGCCATCATC

TCTCACTTGGATGTGGCCAGAGTGTCTTTGCTGGTCTCCTTCTTGCTTCC

TACCTTTGTAACAGCCTATCATCTATCTCTGGTCTCCATAGCTCACTCCC

ATACTTTGAGAGGGCCTTTGAAAGCCTTAGACAGATCATATCACAGACCT

CTATACTGAAAGTCGGG(SEQ ID NO:45)

引物:

F:TGCTATGTCCAGTTTACACATAAGG(SEQ ID NO:46)

R:CCCGACTTTCAGTATAGAGGTCTG(SEQ ID NO:47)

>DG10S2164

CCATCTGTGGAGCAGAGTCACTGAAAGGAAATACTGGAAATACTGGAAGC

CACTTGGTGTTTTATCAAGGATGTGAGGTTTCCTGGCAACTTTGTCGCCA

TATCATCATCATCATCACCATCATCATCATCATCATCATCATCATCATCA

TCATCATCATCATCATCTGCCCTTTAAGTTTTCTGCTTGTTTAGAAAAGA

AATTTATACAGAGCCCCCAGTAGCAGCTGTAAGGGGGCAGGTTCTTGGAG

CAGCCCATCCTCAACATTCTTGCTGCTGATGGAA(SEQ ID NO:48)

引物:

F:CCATCTGTGGAGCAGAGTCA(SEQ ID NO:49)

R:TTCCATCAGCAGCAAGAATG(SEQ ID NO:50)

>DG10S479

TCCACGCAGAGAGGATCTAAATCTGGCTCTTTGCAATTGCCTTCATACAT

GTGCATACACACCACACACACACACACACACACACACACACACACACACA

CAGACACATACATATGCACACACCCCGACTCAATGGAGGACCCTC(SEQ ID NO:51)

引物:

F:TCCACGCAGAGAGGATCTAAA(SEQ ID NO:52)

R:GAGGGTCCTCCATTGAGTCG(SEQ ID NO:53)

为了进一步研究TCF7L2外显子4LD块内其他标记等位基因比等 位基因X显示更高的与II型糖尿病相关性的可能性,我们使用HapMap CEU样品中产生的DG10S478基因型数据。HapMap Phase I中与 DG10S478具有最强相关性的5个SNPs,按照递减顺序,是rs12255372 (r2=0.95),rs7903146(r2=0.78),rs7901695(r2=0.61),rs11196205(r2= 0.43),和rs7895340(r2=0.42)。我们将这5个SNPs在3个群组中进行 基因分型,5个SNPs和DG10S478的相关性与在CEU样品中观察到的 非常类似,DG10S478用作双等位基因标记物。全部5个SNPs显示与 II型糖尿病的关联。尽管一些SNPs在一个或者两个群组中显示稍微更 高的估算相对危险度和较低的p-值,当来自3个群组的结果利用 Mantel-Haenszel模型组合时,没有SNP比DG10S478显示更强的与II 型糖尿病的关联。但是,尽管相对等位基因X(RR=1.56,P=4.7×10-18), rs11196205和rs7895340与II型糖尿病的关联明显较弱,但rs12255372 的等位基因T(RR=1.52,p=2.5×10-16)和rs7903146的等位基因T (RR=1.54,p=2.1×10-17)与II型糖尿病关联的强度是相似的。

在2005年10月公开了HapMap Phase II之后,鉴定了两个其他的 SNPs,显示与微卫星DG10S478的强相关-rs12243326(r2=0.961)和 rs4506565(r2=0.716)。与II型糖尿病易感性相关的等位基因对 rs12243326来说是C(C/T SNP),和对rs4506565来说是T(A/T SNP)。

应当注意在那些载有rs7903146C等位基因的单倍型中间,那些载 有rs10885406A等位基因的单倍型相对那些载有rs10885406G等位基 因的单倍型的估算相对危险度是1.06,但该差异在统计上没有显著意 义(P=0.22)。

为了重复和改进II型糖尿病的这种关联,我们在一个大的追加丹 麦群组和一个遗传多样性更高的西非群组中对DG10S478,rs12255372 和rs7903146进行基因分型,所述丹麦群组由1111个病例和2315个对 照组成,所述西非群组由来自非裔美国人糖尿病研究的618个病例和 434个对照组成(23)。在丹麦人中,全部3个变异体都是与疾病风险 强相关的,和先前在冰岛观察到的一致。但是,rs7903146等位基因T 的关联(相对危险度=1.53,P=4.06×10-14,PAR=24.4%)显著的高于 其他两种变异体提供的关联。在西非研究组中,在对亲缘关系和种族 起源进行校正后,我们重复了rs7903146的等位基因T与II型糖尿病 的关联(相对危险度=1.45,95%C.I.=1.20-1.76,P=0.000146, PAR=22.2%),但另两种变异体不适用该情况。这表明rs7903146的等 位基因T或者其自身是风险变异体或者,或者是未知风险变异体的最 接近的已知相关物。西非组中标记物DG10S478和rs12255372被排除 为风险标记物是可能的,因为与欧洲祖先的种群不同,欧洲人中 rs7903146的T等位基因几乎只存在于同时载有DG10S478的等位基因 X和rs12255372的等位基因T的染色体上,在西非人中rs7903146的T 等位基因与DG10S478和rs12255372的两个等位基因同时存在。这与 观察到的一致,即T是rs7903146的祖先等位基因,而DG10S478的等 位基因X和rs12255372的等位基因T都不同于黑猩猩参照序列。一般 来说,这种发现也与预期相对多样性的种群,例如西非的种群,提供 了与在同质性更高的种群中强连锁不平衡区域发现的关联信号的改进 (refine)的关联性一致。

讨论

在这项研究中我们描述了一个新的II型糖尿病候选基因的鉴定, 所述基因位于先前报道的10q连锁区域内(10),编码10q25.2上的转 录因子7-样2(TCF7L2-原先的TCF4)。我们表明它在冰岛,丹麦和 美国以相似的频率和相对危险度造成II型糖尿病风险。当变异体不能 解释II型糖尿病家庭聚集性的实质部分时,从公共卫生观点来看,至 少为20%的种群归因风险是显著的。相对于非携带者,风险复合等位 基因的杂合体携带者(大约占种群的38%)和纯合子携带者(大约占 种群的7%)的相对危险度分别是1.45和2.41。因此,这种变异体对于 临床使用具有良好的预测价值。

我们报告了作为II型糖尿病相关微卫星的变异体,DG10S478,位 于TCF7L2基因的第三个内含子内。TCF7L2基因产物是一种包含高迁 移率族(HMG)盒的转录因子,在Wnt信号途径中起作用。这个途 径被认为是一个关键的细胞发育和生长的调节机制;它被称为Wnts的 分泌糖蛋白调节,在结合关连受体复合物时Wnts启动靶细胞内许多信 号级联反应,Wnts由Frizzled家族的成员和LDL受体家族的成员Lrp5/6 组成(24)。Wnt信号从降解复合物中分离在这个途径中主要成员β- 连环蛋白,将其转移到细胞核,在细胞核中它短暂的将TCF因子从阻 遏剂转化成翻译激活剂(25)。通过结合钙粘蛋白,β-连环蛋白对调 节细胞粘着也是非常重要的。

TCF7L2的NCBI RefSeq包括14个外显子。但是,Duval等人(26) 显示TCF7L2具有17个外显子,其中5个是选择性的;此外,还有报 导称3个选择性剪接受体位点被使用。这项研究还证明了位于TCF7L2 基因3′端的3个连续外显子的选择性使用,这改变了最后一个外显子中 使用的读码框,导致大量短的、中等长度的或者长的COOH-末端的合 成。

与TCF7L2类似,罕见的Mendelian型II型糖尿病即青年发病的 成人型糖尿病(MODY)的6个定位克隆基因中的5个,是转录因子 (27)。其他的转录因子也与II型糖尿病的发病有关,包括过氧物酶 体增殖物激活受体gamma(PPARγ)(7)和叉头基因家族(28,29)。 Noble等人描述了I型糖尿病相关TCF7基因中的一个错义突变 (C883A)(30)。但是,还不清楚TCF7和TCF7L2是否采用相同途 径对糖尿病的发病起作用。

已经有TCF7L2基因突变的报道,包括在(A)9编码重复(外显 子17)的A缺失(26,31-33)和结肠直肠细胞系中的大量突变(26)。 DG10S478位于明确定义的74.9kb LD块(CEPH Caucasian HapMap Phase II),包含外显子4和该外显子5′和3′端的侧翼内含子序列。有 可能DG10S478自身就是成因变异体;还有可能DG10S478是基础变异 体的替代物,所述基础变异体影响转录、剪接或者信息的稳定性。这 类变异体可能与DG10S478存在强连锁不平衡(LD),即变异体位于 TCF7L2外显子4LD块内。

多个证据表明这种基因在II型糖尿病发病中的肠内分泌功能。首 先,已知TCF7L2和结肠直肠癌的进展有关(54),致癌TCF/β-连环 蛋白复合物的小分子拮抗剂也已经被报道(35)。此外,出生后24小 时内死亡的TCF7L2-/-小鼠,缺乏肠上皮干细胞小室(36)。TCF7L2 基因的变异体可以通过改变促胰岛素激素类胰高血糖素肽1(GLP-1) 的水平影响II型糖尿病易感性,所述类胰高血糖素肽1是胰高血糖素 原基因编码的肽,所述高血糖素原基因在肠内分泌细胞的表达受 TCF7L2的转录调控。与胰岛素一样,GLP-1对血糖稳态产生重要影响 (12)。GLP-1类似物和二肽基肽酶IV的抑制剂当前用于临床开发。

尽管本发明进行了详细展示并参照其优选的实施方式进行了描 述,本领域技术人员应当了解其形式和细节可以做出不脱离附加权利 要求包括的本发明范围的各种改变。

参考文献

1.A.F.Amos,D.J.McCarty,P.Zimmet,Diabet Med 14 Suppl 5,Sl (1997).

2.P.Zimmet等人,Am J Epidemiol 118,673(Nov,1983).

3.W.C.Knowler,D.J.Pettitt,M.F.Saad,P.H.Bennett,Diabetes Metab Rev 6,1(Feb,1990).

4.B.Newman等人,Diabetologia 30,763(Oct,1987).

5.A.H.Barnett,C.Eff,R.D.Leslie,D.A.Pyke,Diabetologia 20, 87(Feb,1981).

6.A.L.Gloyn,Ageing Res Rev 2,111(Apr,2003).

7.D.Altshuler等人,Nat Genet 26,76(Sep,2000).

8.A.L.Gloyn等人,Diabetes 52,568(Feb,2003).

9.Y.Horikawa等人,Nat Genet 26,163(Oct,2000).

10.I.Reynisdottir等人,Am J Hum Genet 73,323(Aug,2003).

11.R.Duggirala等人,Am J Ham Genet 64,1127(Apr,1999).

12.F.Yi,P.L.Brubaker,T.Jin,J Biol Chem 280,1457(Jan 14, 2005).

13.S.E.Ross等人,Science 289,950(Aug 11,2000).

14.E.A.Jansson等人,Proc Natl Acad Sd USA 102,1460(Feb 1, 2005).

15.W.J.Nelson,R.Nusse,Science 303,1483(Mar 5,2004).

16.C T.Falk,P.Rubinstein,Ann Hum Genet 51(Pt 3),227(JuI, 1987).

17.J.D.Terwilliger,J.Ott,Hum Hered 42,337(1992).

18.J.R.Gulcher,K.Kristjansson,H.Gudbjartsson,K.Stefansson, Eur J Hum Genet 8,739(0ct,2000).

19.Y.Z.R.Bagger,B.J.;Alexandersen,P.;Tanko,L.B.; Christiansen,C,J Bone Miner Res Suppl 1,1(2001).

20.G.Benson,Nucleic Acids Res 27,573(Jan 15,1999).

21.R.C.Lewontin,Genetics 50,757(Oct,1964).

22.W.G.Hill,A.Robertson,Genetics 60,615(Nov,1968).

23.C.N.Rotimi等人,Ann Epidemiol 11,51(Jan,2001).

24.C.Prunier,B.A.Hocevar,P.H.Howe,Growth Factors 22,141 (Sep,2004).

25.J.Huelsken,W.Birchmeier,Curr Opin Genet Dev 11,547(Oct, 2001).

26.A.Duval等人,Cancer Res 60,3872(Jul 15,2000).

27.S.S.Fajans,G.I.Bell,K.S.Polonsky,N Engl J Med 345,971 (Sep 27,2001).

28.C.Wolfrum,E.Asilmaz,E.Luca,J.M.Friedman,M.Stoffel, Nature 432,1027(Dec 23,2004).

29.J.Nakae等人,Nat Genet 32,245(Oct,2002).

30.J.A.Noble等人,Diabetes 52,1579(Jun,2003).

31.A.Duval等人,Cancer Res 59,4213(Sep 1,1999).

32.A.Duval等人,Oncogene 18,6806(Nov 18,1999).

33.H.R.Chang等人,Cancer Lett(May 16,2005).

34.N.A.Wong,M.Pignatelli,Am J Pathol 160,389(Feb,2002).

35.M.Lepourcelet等人,Cancer Cell 5,91(Jan,2004).

36.V.Korinek等人,Nat Genet 19,379(Aug,1998).

<110>解码遗传学私营有限责任公司(DECODE GENETICS EHF.)

<120>作为2型糖尿病风险诊断标记物的TCF7L2基因的遗传变异体(GENETIC VARIANTS IN THE TCF7L2 GENE AS DIAGNOSTLC MARKERS FOR

RISK OF TYPE 2 DIABETES MELLITUS)

<130>SCT075777-47

<150>US 60/692,174

<151>2005-06-20

<150>US 60/757,155

<151>2006-01-06

<160>53

<170>PatentIn version 3.3

<210>1

<211>74930

<212>DNA

<213>Homo sapiens

<400>1

cttgtgtagg aactcacgct ttgtttattc agcaatcatt cctccagaaa taaccttaat    60

agcaacaaga aaaaagaata ggtgtttttt gagctctatc tgccagtttc tctatatatg   120

gacattatat attgcaacat aacactcaca atgcctttaa acatcatccc cgttatacag   180

ataagaaaac agaatttcaa agaaggtagg ggacttgccc agggatacat agctagcaag   240

tggcagcgct ggattgagtc tgggccttgt ctgaggctcg ggtcctgtca tgctctgcgg   300

ttgctatgtt gacatgcaaa gggagaggca gctgctggga gtctaggtgg gtttctcttt   360

gagaatgcta acgtgaaccc tcaaggtgaa tcagaatcct tttgcaagtg aataatcaga   420

tgtaggttcc tgtgtctccc tgtaaaatga aagcctcttt tttccaaggt ccagtataga   480

cctgaagctg ggttactctg gaatttccct ctctggctgg agtgactgag gccttgcacg   540

tgacattggt gaggactcgc agcctcaggt ctggcttccc ttagcaaccc ccctttcctg   600

tctctgcctc tggagttcac cattaaaaaa aaaaaaagaa aaaaagccaa aacactttat   660

aaagttacat gctgggtttc ttctatgtcc tagaaactgt cttaattcat cttccccttt   720

actcttatat gagcaggaag aaaaaaaaat tgctagtcaa tgctaataat tatggcatgt   780

aatgtaattg gaagtgtttc actgacatgc tcatgagagt ttgcggcttc atcttcaggc   840

tgggatgtag cactagactt gccttgagtg tctgcacaag cctttgatgc aggtagacca   900

tattataaat aggcgcgttg ctatggtgag gatggcagtc cttgcttgct gtgggtaacc   960

ttttctacct tctcggacac tgttttaaaa cacagcagcg tgatagcatt tcatttaatt  1020

tggaccaagg tggggtagat gaaatgttga gatttagatc taaaatgttg ttgtggtgtt  1080

tcagggggtt ctggctcacc tagtactatg gaagattttg cagattgggc ttcctcatga  1140

tttatttaga aatagatttt ctaatagatg gggtgagggg agggtggtgg gcagaaggct  1200

gggctttctt ctcttccccc tcctcctttc attgagcgct tctgcgaatg tgttggcttt  1260

gatgccccag gagctcatac agtgaaatgg aagttcaggt tggcacgttg cagaaatgat    1320

tattcctggt agtacgtttc ccattactgt taataatata aagacaattg cctgcctctc    1380

aggactcctg cacgtggcta cagtcatttc ttcatggaat tagacacata gcagtgggga    1440

ccaggagtgt tttattagtg attgtcctcc tgcaagtttc cagggtatct cagcttagac    1500

acatgaatta ttttttcctg ttgcttggag ggtatacttt taattatatt cattcaataa    1560

cagagcagtt caggtttgta aaatattttt tctcccccaa ccttttcccc agcatacatc    1620

cccgtcccgt aagtttctgg gcagagacaa tctcaggaac ctaaaggttg ctaaaaaatt    1680

agctagttgg ccaggcgcat gactcatgcc agtaatccca gcactttggg aggctgaggt    1740

gggtggatcg cttgagccca gaaattcgag accagcctag acaacatggc aaaaccctgt    1800

ctctacaaac aaaacaaaat ctagctgggc atggtggtgc atgcctgtag tcccagctac    1860

tggggaggct gaggtgggcg ggcgattgag ctcaggaggt ccaggctgca gtgagccgtg    1920

attgtgccac tgcactgcag cctggatgac tgagtgggac cctgtctcaa taataaataa    1980

ataaataaat aaaaaataaa aaaaattagc tagccaagct gcttataggt cttttacatg    2040

gccaagccac tttctcacct ttaaaatggt aataacgttt ccgtactcat ctcaatgggt    2100

tttgagtgcc aagacagacc gtttgatgga agccctctgg ggagaaaaat gctacccaag    2160

acaggctttt caattggaga ctgatccatt ggtgttttgg tcagttggtg ttgaaatccc    2220

tatttttcca gctcaggact gcctctctcc ctggaactct tcccgaggtg agttctgcag    2280

ccttccttgg gaactctcag cctctggatc ccttcttgcc aggtggagtg gacatgccaa    2340

agttgtgggc cagactcgga ctgcctggct tgtctcagca cctttgggga cccacttccc    2400

ctctctggga actggggaag ctaacagaga tcttgctagg ggggtggaat cctgtatcca    2460

tgtgaggttg tacccccagg ctcctgagtg gtttgaaagt ggggaaccct ggccgggcgc    2520

ggtggctcat gcctataatc ccagcacttt gggaggctga ggcgggcgga tcacaaggtc    2580

aggagatcga aaccatcctg gctaacacga tgaaaccccg tctctatgtg cgtggtggct    2640

ggcacctgta gtcccagctg ctcgggagtc tgaggcagga gaatggcgtg aacccgggag    2700

gcggagcttg cagtgagccg agatcgcccc actgcactcc agcctgggcg acagagcgag    2760

actccatctc aaaaaaaaaa agaaagaaaa aaaaagaaag tggggaaccc ctcccccagg    2820

atgagaagag ccatggggtg agtctctgcc accgccaagg ggagtcaggc tcagaggctg    2880

ctacagggac agccagctct ctttagatgg tccccaccat ctagtcaggg cttgttacat    2940

atggagcaga gacagcgcag gctgctgctg ttttcctgga gaaggcccct gtcggtctgt    3000

tcagctgtag ctgacctttc ctccttgtgc tttttgggga gggagccttg gaaggagtag    3060

ggcacgtggg gcactctgct tcccggcccc acactggcga acctatggat tctgcctctg    3120

attcctgagg aaacatcact gtgaaggtgg aatgagccac atacagaggt ggctgttggg    3180

gccggggagg ggtgaaacgc ccccagggtg tacattgcac caaaagccag gctgcatata    3240

gacctcagga tgggctggct tttctattta tttagaagta tttccagagg gtaacctcat    3300

tggctacaaa gcatgtctga acaagagctc cgttgttcat tcccagccct gttaccctgg    3360

caggatgcag actccaggcg gcctgttggt caggccttgg actcagagag cagtgaagcc    3420

tgaggagggg tggggggcag aggcgtgagt ggtctagggc ctcagtccct ccaggacacc    3480

ccttgccaag cgcagagaaa gctctgccca tccgtcccct caggcagtgg gattgggcaa    3540

cctgggaagc agtgaatgtg cgtcggtagc atagattcca ttccgcacgc caccctcgcc    3600

tccgcccccc agccctggga gggatgcatg ccctccggga gacacccaga cccgacagag    3660

aggcctttgt tggagctgga ggtgagaatc tgtgggcgtt gggattcctg ggttcgagtt    3720

ccagctcact gccaattgcc cgagtgctgg gcgaacattt ctggaatcaa aaggagtgca    3780

gcctgcccag cagggcctac gggagccgga ggctgcaggg tgctaagatt gcgttatctt    3840

taccaagtgc ccggagctcc tgggagggaa gagagagtcc taggactcag gataggaggt    3900

ggttggagtt tctcgaggaa gactccatgc tttggttctg gcccctggaa acccctcctg    3960

aggactggac ctccaagcag accccctctg tgactccgga atgcagtgtt actctcttat    4020

atttttcttt cttttttttt ttttgagacg gagtctcact ctgtcaccca ggctggagtg    4080

cagtggcacg atctcggctc actgcaacct ccgccctccg agttcaagcg attctcctgc    4140

ctcagcctcc caagtagctg ggattacagg tgcctgacac cgcgcctggc taattttttg    4200

tatttttagt agagatgggg ttttaccatc ttggccaggc tggtcttgaa ctcctgacct    4260

cataatccac ccgcctcggc ctccgaaagt gctgggatca caggcgtgag ccaccgcacc    4320

cggccactgt cttgtatttc taacgtcccc ctgacttttc tgatcatgta attcttaact    4380

ttctcaaaac tgagatttgt cacgtgtcct ctccccactc cattttgtga atcagagtct    4440

tccaggggca ggacctggag aatgggtctt tattaacaca catgtgaaaa tgcttttgcc    4500

agcaaggcgc ggtggctcat gcatgtaatc ccggcacttt gggaggccga ggcaggcgga    4560

tcacttgagg tcagcctggc caacatggta aaaccctgtc tctactaaaa atacaaaaat    4620

tagctgggtg tggtcgtggg cacctgtagt cccacctact cgagaggctg aggcatgaga    4680

atcactggaa cccaggaggt agaagttgca gtgagccgag atcacaccac tggactccag    4740

cttgggtgat agagtgagac tctgtctcaa aaaaagaaaa aaaaaagaaa atgcttttgc    4800

catgggctgt ctcctgcttc tgctttgcat tgggcctctg tacctaggtt gcaagattcc    4860

tcagggtgca cctgggctta tcgttatctg taagttatcc cagcaagcac ttaaaacaca    4920

gtgttggacg atgaatcccc tctacaagag agggacaggg caaaaacgac acctcttgcc    4980

tcgcaagctg tcttgggcca aacctcaggt ctattctttc ttttttttga aagtagtggc    5040

tgggcacggt ggcttacgcc tgtaatccta gcactttggg aggccaaggc gggcggatct    5100

tgaggtcagg agttcgagac cagcttggcc aacatggtaa aactccatct ctactaaaaa    5160

tacaaaaatt agctgggcgt ggtggcgcat gcctgtagac ccagctactc aggaggctga    5220

ggcaggagaa tcacttgaac ctgagaggca gaggttgcag ttagctgaga ccatgccatt    5280

gcactccagc ctgggcggca gagcgagact ctgtctcaaa aaaaaaaaaa aagaaagtag    5340

cagctctact gagatattta gaaaccataa aatccaccta tttgaggtgt acaattgagt    5400

gattttctgt atagtcacag atctgtgcag tcatccacac cctctaactc caggacattt    5460

tcctcacccc cgaggagaaa cctcccttac ccattagcag tcactcctca tttcctctcc    5520

ccccagcccc tggcaatcac tgtggatttg cctgttcttg acatttcata taaatggtat    5580

cataaaatct atgggctttt gtgtctgtct gctttcactt agcatacggt tctcaaggtt    5640

catccagtat tgtagcatct atcagtatgt cattcctttt tatggccaaa taatatttta    5700

ttgtatggat agacattttg tttattcatt tatctgtttt tggttattat gagtaacact    5760

actatgaaca ttttgcacaa atttttgtat tgacatgttt tcatttctcc tgggtatagt    5820

cctatgagtg gaattgctgg gtcatataat aaataactgt ttaacatttt ggggagctgc    5880

caaactttta aaaccttggg ttctgtgatg taccagttgt gttaggcagc acagcaaaat    5940

gtgacttttg attgccagaa acaatattta aaaagtggtt ataaaaagtg gtttgggagg    6000

ctgaggcagg aggatcactt gagcccagga gtttgagacc agcctgggca acatagtgag    6060

accctgttaa aaaaaaagaa ggccaggcac agtggctcat gcctgtaatc ccagcacttt    6120

gggagactga ggcgagcaga tcacctaagg tcaggagttc cagaccagcc tggccaacat    6180

ggcgaaaccc catctctact aaaaatacaa aaattagcca ggcctggtgg tgggcgcctg    6240

taatcccagc tactcaggag gcttgaggca ggagaatcgc ttgaacctgg gagactgagg    6300

ttgcagtgag cggagatcat gccattgcac tccagcctgg gcaacaagag cgaaactgtg    6360

tctcaaaaca aatgaaaaga aaaggctgtc atgttagatc caccctcctc ctcaggggaa    6420

cccctgggct gctctctggg tagagatggg aacccaggcc tcgggccagt gagtggaagg    6480

aaactttggg atgattgact tgggactggg ctagaggtga agaatctccc agtaggcaaa    6540

gttcggcctt acgttttttt gtttcaagca aaccacatca ttacccacag aggccattgg    6600

tgagatattt gtaagtctcc tgacagtggc tggagttcgt tgcttggttg ttgtttctct    6660

gtctcagccc tggagatggg agtgaccacc tgctctctct ggacagaggc tgtccacgtt    6720

catgcaattc cttggacacc ggtggtgcag cgggaggcgt aactgggagt gggagaccct    6780

gaactgtgcc ggttcttgca gagtatcact gtgacttcag gcgagtcacc ccacatcagg    6840

cagctcagaa caagggattg atctagaagg acctttcacc tgggctattc tgtgactcaa    6900

attatcttct cctaagccca ctactgcctg gtgtgttggt taaattagcc taaaggtcat    6960

tccctcggag aggccctctg ggaaacctcc ctttcctgag agtcactgct tgctggcgcc    7020

tgcccctggg gttccttcag agtcgtgatc atgccctggc ctcttccttt atttggcagt    7080

cccttccctt ccccatccct gatgagggta gggagcatct gtctgcagct tcatcttcat    7140

tgtctagggg ctccagaaat atctgtgagt aaataagtta tttaatcttt gcctcaaatt    7200

tccagtgact gtagggatat agctgtgagc ctctaggagc tgagattttt taaatttccc    7260

acttaaacat ttatttaaaa attttgtgct cagcatggac taaggacttt acattcatta    7320

actcatttac agcttgatcc tatgcggtgg gcattcattt acagaggatc ccattttaca    7380

ggtgaggaag aggccagcta ggggtgcagc ctaggttagt attctagagc tcatcaggct    7440

gtgttgtccc cagtgaaaga ataagcaaag aagtgaatgt tgtgcattga gaaaaatgac    7500

tctcggagga ggatgagcct ctcggatatg gcgaccgaag tgatatgggg cccttgtcaa    7560

gggtctctat tatggcatca agaaaagatg ctgctttcgg tgatgcccga ggagagcctc    7620

aatattttac atgggaaacc taaaaaaggg gccatgttgt ggtctctgca cctaagatac    7680

taaaggaaat attttatgga gagatgcaac atgtcaggcc ttggagggaa accccaggat    7740

ccagatggtt gcactctcaa accagggccc ccctcacctt ggccttcagc atttagtgtt    7800

ggaaccaata gcataagctt tggtcaggac ctttgatgga agccacagtg ctcattagtg    7860

accacggttg actaccttct ctctcctaag ctgacttctg gagggcacct gggatttccg    7920

gccagtgatc agtgctggtg aagcctgaag gccaatgtgt aggtttagct gttcagtcag    7980

aacccaaaag gggccaaaga gatggtttcc ttcaacctcc actgagggaa gtgaaagtca    8040

tggttcgtta aaaggctgag ctgggaccag agtctagggt tctagaggtg ggaatttcta    8100

cagctttggg ggaccttgca agggcatttg ctcttctggg actgcaggga gactgtgctt    8160

ctcagagatg ttagcatttg gcttggggag agagaggaaa ggagaggttc atgctccgcc    8220

atgatggtgg aaagtgatgt tggtgtggtg aggagctgag ctgaattcta agtggttcca    8280

gggaattaac aatgttcctg cccaagtgtc ctgttccccc acaaactaat gaggcagcag    8340

gtgtctgaag agaaacattg cagaatgtct gccaggggtt ttatggttaa ttttcctcca    8400

ttatgagggt tgactcagcc ttgggtatta gatgtctttg agaatccagg gttcaaatac    8460

cacagctggt agaatgtttc tcaacttgga gccaatctcc atctactgaa ggtacgctgg    8520

tttagacaga caacagggac atcagcattt taaaaagcgg tggaaaaagt ttgcttgtct    8580

tgattggagc catgacattt tattttgaaa tttcaaataa catgaaggga ggtttggagc    8640

ggtttttggt ttatccaaag ggcagtggat tgaaggctga gaaacaccag gctgaatggg    8700

agaggggttg gggtccccct gtgagatagt gaaacaatgg tagtgccatc caatgatagg    8760

cacttttctg tcattcagaa gcagaaaggg ggccagaggc ccattggcct tactgggcag    8820

taagctgtag agctgctgcc ttttcgtgaa agggttgaca ccaaccttct cccccaggaa    8880

gagtgaccag ggacctgagg ggcatggtcg agcagatgac agcctttgta aaacatctcc    8940

ctggtctcat cagcgatatt cgtcctgcct tccttctgag taatttccat cttaggactg    9000

gagtcaggtg gagcaagatt ccatgttggt ttctgttggg cctagagtgt cacactgaga    9060

cctaatttca tactttatga attctagtac tgctctcgaa ggtaagagcc gtcctctttg    9120

gctgaaggtt tttgcctgca accttgcatt gtaatccagt gacacctgac gtatctgtaa    9180

atttcttcaa atttctaagt gtattacaac cccgtgtgca aaagatgatt aattaattgc    9240

cttgacagta aaacaaaaaa caaaaaaaag gtgtgggggt atatggtatc cctgatttac    9300

tatagaagat gcagagagtg aagggagatg aggtggggag gaggggccca ggttctggtc    9360

ctactttttt tttttttttt ctaaagagat ggagtcttac catgttggcc agtctaggct    9420

tgaactcctg gcctcaagag gtgctctcac ctcagcctcc caaagtgctg ggattatagg    9480

cgtgagccac cgagtttagc ccaggttctg tttcttgctt agtcactttc tgtttgaaca    9540

aaattggaat ttcctttttg gatctgtttc tttaattgta aattgaatcg gactaaaacc   9600

tttccaattt tttcacatgt gaagacatac acaaaagttt tattggaggg ttgcacatgt   9660

gaaagaaaaa gggagaaagc aggattgagc agggggagcc gtcagatggt aatgcagatg   9720

tgatgagatc tctgccggac caaagagaag attccttttt aaatggtgac aaattcatgg   9780

gctttctctg cctcaaaacc tagcacagct gttatttact gaacaattag agagctaagc   9840

actttttaga tactatataa tttaattgcc gtatgaggca cccttagttt tcagacgaga   9900

aaccacagtt acagggaagg caagtaactt agtcaatgtc agataactag gaaaaggtta   9960

gaggggccct ggacacaggc ctgtgtgact gagaagcttg ggcacttcac tgctacattt  10020

catctcttcg ctataaacat tttagctttt tgtgtttgct gactggcaac aatacatagt  10080

gaaagttcta ataatttgta atgcttttgc atgtctttgt atttttcttg gttatcacat  10140

cacatcaaat taagatactg atcagcagtg tgagaggtta tttttccatg tcctcttcat  10200

tagtgttagc ttgtggatgg atttgaggct ctctgtgctt tccccccagc aaagtgaata  10260

ccagactttc ctattaaaaa aagtatttta tttttcagag acagggtctc attctgtctc  10320

ccaggctgga gtgcagtggc acaatcatag cccactgcag cctccaactc ttgggttcaa  10380

atgatcctcc tgcctcagcc tctcttaagc agtgcctttc cccattctca tgggactttc  10440

caatccatga gatactttgc tgcagggaag ccctgtctgt ccaggcctgt gtaatagacg  10500

acttcacatg gtcctgtgtt gttgtttgcc ttctgtgtgg ctaagtttcc atgacctggt  10560

ggcttggaag ccccatccct gatttgtggg agaggcaggg aggcaccttg tagcgcacta  10620

ggcgttgggc ctgaacaagt ctgtgtgctt ccaatgtctt tgtggggagg tttacgagtc  10680

cttcttatta tataatagta tcttgtctta gcttggtgcc tttcttctca gaagcttgag  10740

gcactctgca gataccatct caatttgctt tctgggagga ggagaggaag ctacccaaaa  10800

gatgaagttc tctgtgaggg gcttgaacac aggttgatag cgttgctggt tagttattct  10860

catggtgtgg atgaaaaatg gaatacgctg aaatttcagt tactcgtcac aaaaataagg  10920

cgtatgtaga aaacatcctg ggctaagggt ttgcatgctt ctagaacttc ctgttactta  10980

atggctgttg agtataaacc tcgggaacag tggggatcct tggagacccc aaataacttg  11040

tatttgtggt tactcctgtc ttgtctatca atacccctgt ctatatcgtg ttagaactag  11100

gacacacaga ctggattcag aagctggcct ggggtttagg agaacatggg acctaatcct  11160

ggccatctcg atttacctcc tggatcttgt tttctcatct gtaaaatgaa ttggggtgtg  11220

gactgtttat ggcctgtagg atgctagccc tgagaatttt ctccagatat tctacggtta  11280

agtaatttta ggggacactg tctaagcagt tgcctcttgg agaatgaaga tgttcattag  11340

gatattgaag gctctgagaa gtcctaaagt taaagaaaat ctgcaatgtt ctttgtggga  11400

ccgaataatg caacctggga aatgagggat tagatgacac ttgagtagcc ttccagatct  11460

gagacgagtc tcactctgtt tgtttactcc atctgtgatg ggtgtaggca ccatcttggg  11520

gagcaagctg tgatagagag ggaacaatac cttgttaatg tttgtctaat tcactaccca  11580

ggtgcatggt agtgaattag acactacttt gtaggttctg gagggaagaa gaaaagacga  11640

gacctgcctg gactggggct tgagaccact gtcaaataca agtacagttg tacaactggt  11700

agggagtggg tcatagtatg gccggtcttt ttaaaggtga ggaattctta ggcccagaaa  11760

ggcaaagtga cagatcctgg atttaaccag cagcccagat ttgaggccta gcacatagca  11820

aagcaccata gctattcaat agctgccaag tgggagtttg gatgatggct ttcctggaca  11880

gcgaaagcag tgatgtttgc ttaggatggc ctttggcagt gctgctgtta tccttaccac  11940

tggcaagcca tctcacgggc ccggagggga gggcaaggaa tcctaattct gtgagaaggc  12000

tctgggtaca tgagtgtgag atatggatac cctaggctct gcccctgaag acagtggcat  12060

cggatttact gcactattcc agtcggacag gcaccttaat ttttctcttt ctgggtgttt  12120

gatatggttg ggtcctattt cttctcctcc aaaccccgct agggccattc ccccaccctt  12180

cacttcccgg ccttccactg cagtctctaa ggattctgct tcatctttat gtgtgaacag  12240

ggttttgaca aacatgatta actgggtatt tttggaaggc tcaggaggaa cgcagagtgc  12300

tccggagggc aggcctggag tcaggaatgc ttcctgcaac ctgttcgtgc agtgagcgtg  12360

tcttcctcgc cctgcccttg gctggggaat gtgctggctt ggagggcagg agagtgacag  12420

gcggtttgag aactccgggc tctcccgtct tcggatggct cctgtgaaag cagggcctga  12480

aacttttatc gtcactgctg caggtgaaag actttcattt ggctgtagtg gtccaacaaa  12540

gagtatttta tttatgtgtt tccaagccct taaaaattct tttagggcac atcagtgggg  12600

agttaataga aactttgaaa taagaaaaat gcctgcaggg taagtagaac cccagccagc  12660

cagctccgag ttctgtgctg ttagctggta ggttggttct cagagaagtg gctggctggc  12720

tgggttacgg agcccacatc tctaatgcct tagtgttcaa tcattaagtg gatttttttt  12780

tttcccttct cttcttttgg tttggaggga ggactactct aaactttact cagggcaggg  12840

tagctcctga aagggctccc taacctttct ggtttatgac acaaagaaag tttggaggta  12900

ctgggataag agatggcttg ggtgaccccc ctatcatgcc ccctaacaca tacacagcaa  12960

accaaaccaa ctcacccttg atcatactcg ttgtttacac gaagggaatt tttattgtct  13020

tgtgagtgtt gagtgatgat taaacagaag agatgtgact ccaagcctgg cttcactaag  13080

atagtcttgt ttgtttcttt tcctccaaag taatttccta aagaattaaa agcccctttg  13140

aaacccagca ctaccttgtc tctgattatc agcataggca ggaagggctt ttaaggtctg  13200

agcccagctg tttagaggct acgagacgtg aggcaaatcc tggtatctct ctttgggcct  13260

cagtttcttc atctgtgaaa tggcacagta ctaccctcca ccaaggatga tgatgagaat  13320

taaatgggat gacaggtttc atccccagct cctgttctta ggaaggaaaa actgtgactt  13380

atgaagcctg taggttgtgt tcaggtttgt atgaggcctc ggacttcata caaaggtatc  13440

aaagtggcaa accctgatcc agatgttttc agttcagtca gctggtcctt gagcctgttg  13500

tgtgccagat atcctgacca aagaagctag atgggagctg ctgtgttgtt ccttggggct  13560

gctggatgca agttgtttag gtcggcggtt ttcaaatgct ggtgattttg ctcaccagag  13620

gacatttggc aatgtctaga gacatttagc atggccagtc attgggaggt actcctggca  13680

tctcgtgggc agaggctaag gatgctattg aacatcctgc aatgcccagg acagccccct  13740

gtgacaggag tcatccagcc caacatgtca ctagtgctgc agtggagaag ccctggctgt  13800

gtgtgggggt gtgtgtgtgt cctcttctac atttgataag gtaactcaca cttgctgccc  13860

ccatgatcgc tgtgggggat gcttatctat gccccagtcc tggtgttggt tgatgggaac  13920

atcaagattc aggcaagatg gaaaatagcc cttagaacta gcaggaaaag aatctccttt  13980

catttgtcta gaggttctgt taaagtgcct ttgcttctat tttgagactt gttcttaaaa  14040

aaaatgcgga tatgaaagaa aataaaaacc acattatccc tccacttttt cttggaggag  14100

gatgtgttga agaagtcaaa gttcaccatc cctttagata gaatcatttt gaacaatttc  14160

atatgtcaat acattttgct catctctaaa tttcatttta gagcctgtgg tgttctgtgc  14220

atggatatgt gtgcgtgtat gcacacaaaa ataaaaggaa atatttattc ttatgaataa  14280

gtatagaaat aaattaattt ttggaatctc aaactatcag agacttatgt aataaccaga  14340

ggcaggcctg attatgtatg ggcaaagcat ttgtgaacaa tgtctccatt gtataacata  14400

caaaacaagc ttttcttcca cattggatat gcaagtcggc cttctccaat aagggcctgt  14460

ctctttccaa ctccccccac ctcccacctt tgagcaaaca ttatttattg tggctgatgt  14520

gtgatcaggt cttgatttgg ggcctctttt tgatgccttc tctttgtggg atctcaccca  14580

cgtgcccctg gagacccttt ggctgccagg gcctttgttt cccagccacc catgtggtgc  14640

cagtagtgtc tgctttgtag cgagctgtcc ccagagcctc agcatggctt ggggatggtc  14700

tctgaggttg ggcttggatc cctcccactt ttgggctcag aaagaatgac tgccctctat  14760

ttccctgtcc ctgccctctc ttatcctgtt tcccagcccg catcatgtta tctttgcttc  14820

ttgtaactta ccaaacgatt tatgggcaag taggggaggt gaagagggaa ctcatctatc  14880

aagataacct actttgtgcc aaccactgag catagcaatt gtcccttctc cagccctctg  14940

aggaccgtgg atgggattct catgaaatga aacaggtgag gaacttttct tttagggaac  15000

ttgcttgagg tcccacaggc agcgagtatc aatcaacgtc aggatctgag ccctgttctg  15060

ttcggctgaa aatatactcc ctgagatggt gtaggccacc atggctttca gcaggctctg  15120

tgcttggtgg aaggaagctg gaagctgtgt acacacccac ggggaacagg gaccatagag  15180

gagcaccttt tgagtgcaga acctggcgaa acatacacct ttagagggat tttaggtacc  15240

cttgaggctg ggagaatcaa gcagagctaa gtttcccatt ggggtgtcac agactgaaga  15300

aacagagccc taggtagcac agggaagttg attgcccagt atcagttagt ttggctttaa  15360

tgactgagaa gagattccac cagttcattg aagagagggc ggacttttta ttggaggaaa  15420

gaagagtgcc tgtaagtaga gaagtctccg gggtgtagtg ctgtttgggg caggaagaac  15480

agtgtgagcc actgtggaga gaaagcccaa agagtcttgg cagggcaggg agtaggatgg  15540

atttgaagcc agaggaagta tggggtctct gtagactcca ggcaagccat gttaatattt  15600

taggaagccg tgatggagct gcagatgggt gtggaagtta aagtttaact gttcattcac  15660

cagtccttcc cctggagaat gtgcagcacg tggacagtgg aactttaagg tccttggctt  15720

gtatttcaca cccaagagat gaataggtcc aggtatgtca tagaccagac taatgaaata  15780

acaaatttct tttcaaaaat tttacttttt gtaggaaagc ttctctgtct ggcatttttc  15840

ttctcccagt tgtgactcaa tcttaaacgt cttcagacaa ttagcataaa atttcccaca  15900

gtgaattgac gtatactttt gagggttcca tttctttttt attttttttt tcttttgaga  15960

tggagtttct cgtcacccag gttggagtgc aatggtgcca tcttggctcg ctgcaacctc  16020

cgcctcccgg gttcaagcga ttctcctgcc tcagcctcct gagtagctgg gatgtcaggc  16080

acccgccacc atgcccggct aattttcgtg tgttttagta gagatggggt tccaccgtgt  16140

tggccaggct ggtcacaaac tcccgacctc aggcaatccg cccgcctcgg cctcccaaag  16200

gctgtgatta caggtgtgag ccactgtgcc cagcctaggg ttccatttct taacccctcc  16260

ttctgatgcc tcagaaagtc ttgctctgta agcctcttgt agctgcctcg gttcagggga  16320

agggggaggc ttttgtttta ggaccgtcca gaccatagac acatttcctg gcacctagca  16380

cgtgttgggt caaacaggaa tgatgaatgc atgcatgaat gaggttctta gcgctgaaga  16440

cggtgtcata ggtggtctac cacgccgcct gatcattcca atggcccatt atgaatgtgt  16500

gtgctgcagg gccctcccac gatcccgtca gcactgtgca tgttgtgggg aggtgctggg  16560

agaaagactg ggtctcagaa gatgggttag aggtgggtcc ttctctgctg ctggctagca  16620

gggtagctgt ggaggggtgc cccatcttgc tggtcttaaa ttttctcact gtaggcaggg  16680

agcatgacct ggctgaattc taagtccttt tctactctga ggttcattgt gggtgtgacc  16740

tgctgggctc agctctggct ttgggagaca ccctctcccc ttgatctcga caacccctta  16800

gcagagccca gtggctccta cagtgccctg agctgcttgc ccgaaggatg cggttgtggt  16860

tatctcaccc cctgccaccc tgtttgcgca agggtttgag attgtgtggc ccctccttgt  16920

acttcggggt gaggcttgct ccagaaaggt ggtctgcaaa ggggttggct gggggggagg  16980

aggaagtcat tctccaagtg tttgtcctca tcgttatccc aaattgcttg cctggaataa  17040

ggaaggaaag aaaaaaaaat actcttgagt ggtttgggcc aggattttag ctgatggatc  17100

tggtagttcc ctctgtcaga tttgttttct ttgaactgtc tgggccggtc acagtgtcat  17160

tgtttaaatg tggaatgtag gtgttctgtg ttctgggaaa taaaaaccaa aactggtcca  17220

ggggatccac agaggtaaga aaagaacatt ccaataggaa tgtttcagaa ccaggagggg  17280

aggagagaaa aacggctctg ttggtctcct agaggaagaa cttgttagat ttggggagag  17340

tcaggataaa tttgacccta agagtctctg attcctttta gagacttttc ttataagaaa  17400

taaaatggaa cttgggagag gcggcaactt gggaaacagc acattctgcc gtaatgaaag  17460

tcgtcccata agaatttctc tatcccttta gccaaatttc tgtttctaaa aggggaaaag  17520

gggctagaga taggcttgtt tgttttctta gttgaatctt actttttgta tttccagccc  17580

attctgcagg gtaagaacaa gcacagcccg agggctcact cagtgtgatg ttctagagcc  17640

tggctctgcc tcaatccctc acgctggagg atcaggcagc aggggccagt gatggatttt  17700

tttttcttcc tttcctcccc tattaatatt tactgaggta taaattacag caaagtgcgc  17760

agacctaggt atctaggact gtgaggtttt cctgtgttac ctgtgtaacc acgacccaga  17820

tcaagataag gaacttttct ggcatctcag aggctcttcc tgctcccttt cagactccgt  17880

ctcccagaag gaactacttc tgattcctat agccatagac tgaattttct tttccaactt  17940

catatgcata ggatcatcat gggtgtttta attttaattt catgtctgct tgccactccc  18000

aaatggaaat gtgttggcat ctctggatgt ttcttcataa gaaacatgcc ctgtggggca  18060

aagcccagga cagggctgtg ctgctgctgg aagtcctgtg cagctggcca gcctctgctc  18120

acccctccgg ccacgctggc actttcagct tctccagcct cctgcccttc ccacttccag  18180

tcctgcacct gctgtcctca ctgatgcacc tgcccttttc cttccgtcct ttatgtggca  18240

cacccttaag ggagacatct tcctgtctgt gttttgcacc ctcttaaaac tacattcctt  18300

tcccttcagc attggcatct ctgtccttgt gtattacctg ggatgactat tcagttaaca  18360

aatgctttct tcctaggctg tgagcccaag tttgttggat gattggatgg gggcacgttg  18420

tgtgagagaa ggatcatggg gtagcatctg gctctcttag aggtgtgtgg gggcgtgtga  18480

tgcctgccaa ggcgctttcg ttctgggggg ttctgtgtgt ttgaagcact tgggttgtgt  18540

gtccctgagg cctccgtcac gggcaacctc attccttctc tagcctccat cccctgcccc  18600

ctgcccaccc caggcctctg gagctggctc cctttcctgc tcactctctt ttggccagga  18660

ttttaacata tatcacaggc tggtaggcta agagcttggg acttcccctc accacactca  18720

aagcctttga tcttttgctt tggaggtaac atcaaaagga aggctgagga agacagccag  18780

gctgtgaagt tcaacgttca agttaatagc ttgactgaag gttgtgctgc gttgtggcag  18840

catcaccgag gctggagtaa acagagtgat tctgccacat tttcctggaa atgcacccca  18900

atattggaag agggcttctt ttacattcgg aatgaattca ggctgtagtc agagctgctt  18960

ttccctttcc ccattttcct tggaagtgtg aaaacttggg ggagaagatg tttgtaggag  19020

ggcatgatga ggggtagagg aagcccaaag agaggatctg gggaggggaa gccccatggg  19080

atgagactct gaagttatcc ttgccccgat tccgggactt gctatctgcc tgccttttgg  19140

cgtggtgtct ctgtgcccct gactgttcct gatttagcga ggtgtttctg aattctgatg  19200

gaattcaaag aagcctgggc aggcaggcag cttgacttgg ggcttgggga agcgtgcagc  19260

ccagacatag cagcgatgag agggcctcag ggctgagggc tgagatgaga atttcatcac  19320

atgcaaaagt gaaagcgacc catcgtcttc tccacttgat ctcttgctga gctttgcaga  19380

cactttggtt gttgtttaat ttaacatttt ctgcaatgct ccttttttca gattttcatc  19440

caaagctctg tatgagaggt tttcaaaccc attttggccc tgattctatt tggcatacga  19500

ttcaactctg gggatggtca tcttccccac acctgcgttg ggtacctttt tggtgtatgc  19560

tcagagcatc cttggacatc ttcctggtca gtgtccagca tcgtgaagct gccctttagc  19620

ctctcagtgc ccccagatac acctgtctct ctgcgtagcg gcactcagcg tcacctttct  19680

gtggggtctt gagaccctga tgatatcagc actatgctgc cagaattccc cttggattct  19740

ttagtgtggc ttctcaagca tcccttatcg ctataacgcc ttcatggttt ttggcataac  19800

tgtatactac ctgtgctatt atttatttga tgcattcaaa catttgattc atttatttaa  19860

actcagtctc actgtaatcc ttaattaaca cctgtgaaat tataggtttg atgtgctact  19920

tatttattta ttttttaata cacattagta taatcccgta acggctaaag taacactttg  19980

tactgcctaa aaccatgctt gggagcgcca cagtttgaga aagtgcttag ccttcctttc  20040

cctcctttag tgacttgtgg tttggggcat ctgttgactc ctagggctcc cttgttcatc  20100

tttctgttcc taagctcagg gattagttgc tcaacccagg tgtggcctca aaattctgct  20160

catggaatag cctcaggctt ctataaatct catctttttt gttttgtttt gtttttgttt  20220

ttgagactga gtcttgctct gttgcccagg ctggagcaca gtggcgcaat ccactgtaac  20280

cattgcgttc tgggttcaag cgatcctccc atctcagact cccaagtagc tgggactgta  20340

ggctggtacc accaggcccg actaattttt aaattttttg aagagatggg gtctcactat  20400

attgcccatg ccggaagtct agttttatag tgatgagaat tcatctgggg tccaaggggc  20460

cctcctgtgt tgcttcctgt gctcccctct aaataaagat actccttcca agttgtcctg  20520

attttcaggt catcaccatt ttttgagctg gatggggaag ttggcctgga gcagccttcc  20580

ctgtctccga gttgcattac ctcctgagag gtctcagcaa atcactgcca tctcttgatc  20640

agagttgctg gcaagagtcc tctgtggttc taggttttca gccctggaga ctctcgcctg  20700

cattcattat acatgtcctt ttggtgcctt gttgaaaggc atctcctgcc accgaagggt  20760

gtgggcttct ggaaattctc agaaaacaca atatgccagc ctccagggat gggtctccaa  20820

agcttcagga acatatcctg gggtgttgag gaaacaccca ccttaaaatg ttcctcaagg  20880

gggaatgtta ctgcttgccc taaccctctt gagctgatgc tcacatgacg tccctgagat  20940

gggcttcttt tttgcccgta cttaaagctg taaagggcca ttgtcaaatt tgtttagctt  21000

ctcaattcat gttccttaga ggatggtaaa ttaaagttag cattcctgga cagagccttt  21060

catacattga agacaacccg gtgagtctca aggggagagg taagggagag atgaaaggtt  21120

ttctccaggc ctgttcggca gcatggactg ttcttttagg taattaaggg agaccataaa  21180

agacaattgt gtgagtccat ttacctttca cttgggggtc ttaagtcttt ggttgggctt  21240

ctttaaccct gtgtgtcacc cacgggctcc tatgggtgct gttttcattg ttccgttatc  21300

tagttggctg gaacacacct ttggggattg gagaatggag ttctgggggc tttgggaact  21360

ttgagttttc ctgcaatgtc ctatagaagc ttgagtctgt gattcctggg cagggccttc  21420

tcctagttga gtgagattgg tggggcaggg cagccagtta gggggtcatg ggagcaggtg  21480

tggaaaaggt tatatgtctt agtaattctt tgtgacaatc accctcattc attgatatct  21540

tcttcctatc atgtattagg gcagtggttc ccccaatgtg ctgcacatta ggttcacctg  21600

gagagctttt ataaaaatgc caatgcccgg ggcccacttt gggaggagcc aggcatcagt  21660

aatttcaaag gtctctaaat gatttacagt ttgggaatca ccgtatgagg atagtaagct  21720

ctgagtccta tgcgttctgt gccgaacacc catgaagcag tcttccaagc attttacctg  21780

catcatctca attctcacac tgttaaggag atagacagta tcatctccat tttgtagaca  21840

agacaactga atctcagaga ggtttaagtc tcaggacacc aaggtcatta ttaatcaggg  21900

ggactgtgat tgctcccttt ataaaatgta ggagatattg tggagtacgg ttgagaaacc  21960

attgcaatag ttttcttact ttgttaagaa attaggctgg gcgtggtggc tcaggcctat  22020

aatcccagca cattgggaat ccgaggtgga cagatctctt gagctcggga gttccagacc  22080

agcttgggca acagggtgaa accccatctc gactaaaaat acaaaaatat tagccgggcc  22140

tggtggtgtg cacctgtagt ctcagctact tgagaggctg aggtgggagg atcacctgag  22200

tccggctgca gtgagctggc attgtgccac tgtactccag cctgggcaat gagagtgaga  22260

tcctgtctca aaaaaaagaa aaaaaaggaa attagtggtg gaaggtgact ttgcatctgg  22320

gcgtatctgc ctgcagagtt ggtgtcctta ccttgaagaa accctgcttt agttggagta  22380

tccttaatgg ttagtggcag gaggggagga gtggttcctg ggagactgga acaaaatatg  22440

gtacctgaat gcttaaggct tggcagatga gcagtcattt tcttacacag agcttaggaa  22500

agggcatcca ggtagaggaa tcagcatgaa caaaagcaca gggccataga gttctcagaa  22560

ggaaagatgg ggttaaccgg agccaagcca gagatctggt ggtagtgggg ggtttccaag  22620

ctagaatggt tgtgtggtat tctgtcctca ggggctttga actctgtgtg ctaatgaggc  22680

ctcaaattcttctggggctct ggttaaaatg tagattctga tatcagttgg cttgggtggg  22740

gccttgcatt tctgtaagcc cttagcagtt gcactgctgc tactaccgtg agtattgctg  22800

ttgagcatta ctaccttgag tattgctgtc aagtgttact accttgagta ttgctgttga  22860

gtattactgt cgaattttac taccttgagt gttgctgttg agtattacta ccttgagtgt  22920

tgctgttgaa tattactact ttgagtatta ctgttgagca taaccacttt gagtattgct  22980

cttgagtatt accaccttga gtattgcttt tgagtgctac tgccttgagt atcgctgttg  23040

agtattgcta ccttgaatat tactgttgag tattaccacc ttgagtattg ctcttgagta  23100

ttaccacctt gagttttgtt cttgagtatt gctaccttga gtattgctgt tgagcattac  23160

taccttgagt attgctgttg agcattacta ccttgagtat tgctgttgag cattactacc  23220

tcaaggattg ctcttgagct ttaccgcctc aagtattgct cttgagcgtt actgcctcga  23280

gtattgccgt tgagtattac tcccttgagt attgccattg agtttagtcc tgtgagtatt  23340

gctgctactg cgccttggca atggttttca aactttgcaa cacatcagaa tcacttggga  23400

aacctttaaa attctaacgc ccaggtcaca tcccattcca actagatcag aacatctggg  23460

gaatgcgagc catgcaccag tagttataaa acctgcccag gtgattccaa agtgtgggaa  23520

cctttgagaa gcactgcttt aggggttgga atagtcctgg ctgaatttta atcagggaag  23580

actgactgct ccgtttatga aacgtaggag agtggagcag ggttgagaaa ccatcgggat  23640

agtgttctta ctttgttacg tgagcaatat ttgttgagtc tctgtggtgg gttctagggg  23700

ttcagaggac agcagtgtgc tgctaggatg gtggtctgaa ctagtggaaa ggcactcaaa  23760

ggaagaaaga cagaattcta agaggagagg aattttagga aggagatacc caggactttt  23820

gaattacagg taatttgatc agaacccaaa actgaaatgt ctctgctctg tgatgaaagg  23880

gtttgctggc attgagtaag gagctgcagg aaggccttta acttgtctcc aggtctctta  23940

acagctttgt catttacata caagcacctg cctggctaaa ccattcattt ctgtagcttc  24000

cttctggatc tgtctaggga atatttgctt tgcatatttt ggggttatct taagtgtttg  24060

aaggaaccaa aatatttttc ttaaaaataa cactcaaatg tagttcacat gattaatttt  24120

gactgatttg tgagaatcag taagtgctga ctgactgagg cgccccacac atccggcttc  24180

cttctgttac tctacgcgtg ttgctgaaac ttaacgaacc catgtggggt cttctcgcct  24240

ggtgcagtcc ggcccagtat tcatactgag gtttgcagtg ggagaaagga aggtatttat  24300

ttgtaggtca ccaagcaggg caaatccagc agctcacgct taagacctga cctctcccat  24360

ggtttataag caagtggttt tttttttttt tttttttttc agactgagtc ttgctctgtc  24420

acccaggctg gagtgcagtg gcgtgatctc agctcactgc aacctccgcc tcccaggttc  24480

aagcgattct cctgcctcag cctcctgaat agctgggact acaggcgtgc gcccccacac  24540

ctggctaagt tttgtctttt tagtagagat ggggtttcac catgttgccc aggctagttt  24600

ccagctcctg acctcaagtg atcctcctgc cttgacctcc cagagtgctg ggattacggg  24660

catgagccac agtgcctggc ctgtaagcaa gtgtttttaa agaaaggggt aaattttagg  24720

gaaacagaag ttctaggcaa aatggtaaat taatacaggg aggtaagaca ttggtttggc  24780

ctaaaaagat gggatatttt gaagtggggg ctcataggtc ataagtggat ttaaagattt  24840

ttttggtttg taattggtta aggaagataa gctttgatta aagatttggg gtcagcagaa  24900

agaaatgtta ggtctggctc gtgggcatgt ctttttctag gcccctcctt ggaaagaact  24960

ttagagcaaa gaaaggcagt tggagcttag tccccacttt ctcctgatct gaggtctacg  25020

gaccactgga tccatttggt ggggtccatc tttctgaaaa acaagtcagg gacatgtatt  25080

gagatgatat tattggtatt tatagggaac caaacaacgc cccatgactc ttttttggct  25140

attgttttaa gccactgttt ttttttgttt attgagttgt taacttattt tttaaagcta  25200

gctagctgcc tggaatttct ttagaaggaa ctgaagtttt taaaaatttt tatgttgggg  25260

ggtattgccc tgcaggcccc taaaaggggt ccctgcgctg tctcaaaact tggatgcaaa  25320

aagaagttga gttaacacag gaggacaggg gtagacgcac caagggcatg tgcctcgagt  25380

gcgtggtcct tattaagaag ggtggttaga cagggaatgg gttagttccc aggtcggcat  25440

tcagctgaaa cagtgatggt taaaattctg aaaaatgtcc acgctctgca ttctcttcct  25500

aacacccagg acccagtaac tataaagccc cctaccctgg ggcatagcag ggggcttcag  25560

ggacccatga gaaggtcatc tgctgctagt tacactcctt ctgggacctg atttagacag  25620

tttggtggta gttttgcgag ggttaatttc agggccaagg atgcttctag aatggaaata  25680

ccttcttgac attgggagct ttattggttg attatgtcaa tgtgagaatt caggaagccc  25740

agtgctaatc ctccatccta aaaggagtag attggctggg cgtggtggcg catgcctgta  25800

atcccagcac tttgggaggc cgagggggcg cggatcacct gaggtcagga gttcaagacc  25860

aacatggcga aaccccgtct ctactaaaaa tacataaatt agccaggtgt ggtggtgggc  25920

gcctgtaatg ccacctactc gggaggctga ggcagggaga attgcttgat cccaggaggc  25980

ggaggctgca gtgagccaag attgtgccac tgccctccag cctgggcgac agagcgagac  26040

ttcatctcac aaaaacaaac aaacaaacaa acaaaaacta aaaggagatt tcctccttct  26100

gtcctttatg ggagacttca accttgggaa agtctggaat ccttggacat tagaaattct  26160

gaagttttgg ctggctgtag tggctcatgc ctataatccc agcacgctgg gaggccgagg  26220

caggtggtca cttaggccag gagtttgaga ccagcctggc caacatggtg aaaccccatc  26280

tctactaaaa atacaaaaat tagctgggcg tggtagcgga cgcctgtaag cccagctact  26340

tgggaggctg aggcaggaga atctccagaa cctatgaggt ggaggttgca gtgagctgag  26400

atcacaccat tgcactccag cctgggcaac agaacaagat tccgtttcaa gaaagcagaa  26460

actctgaaat ttttgcctgt ccaggccaca tcaatcccat tcctctgctg tctctgcagg  26520

attctgtgag gaataattag ttaatgtttg cagagcactt tgaaatcctc agatgaaagg  26580

caccggagaa gcacaaagta ttattattta ttattagctt gccccagaat ggaggcgcat  26640

gaggccctgg cagctccctg cctcgtgcca ggtgtgatcc tcctgctggg cttttcctgc  26700

ctgatgagct tttttttttt tttttttttt gagatcaggt tcagctctgt cgcccaggct  26760

ggagtgcagt ggcatgaaaa cagttcactg cacacagctc actgcactgc agcctcaaac  26820

acctgggctc aagcaatccc cctgcctcag cctcccaggt aactgggact atatactaca  26880

ggcatgcgcc accactcctg gctaattaaa aaaaattttt ttttgtagag atgggggtct  26940

cactatgttg cccaggctgg tctcaaactc ctgggcctca aagatgccaa aggttcacac  27000

cttggcctct caaagtgctg agatgacagg cgtgagccac tgtgcctgtg ctcaattgat  27060

tttctttatt aaagaaacat ggaagaaagt gaaggatgag aatcagtaac gtaacgtgtg  27120

cttcagattg tggacaagtg atgtgaagga aacacattgg tcccactgtg gtgacagagc  27180

aggggtttcc ttacctggca aggttgcggc tgccattcct tggggtctgg ggttaagacc  27240

atctgcctga gggtaacgca gtaataaatc agtactaaag ggcgtactaa agtactgtat  27300

tgctaggcta ggccatgctt ggtgtatttt tttttttttt taattgagac ggagtcttgc  27360

tttgttgccc aggctggagt gcagtggtgt gatctcggct cactacaacc tctgctgccc  27420

agtttcaagt gattctcctg ccttagcctc ctgagtagct gggattacag gcacgtgcta  27480

ccatgcttgg ctagttttaa aatattttta gtagagattg ggttttgccg tgttgtccaa  27540

gctggtctca aactcctgac ctcaagggat cagcccacct cggcctcccg aagtgctggg  27600

attacaggca tgagcctggc tggtgtattt gttttaaatt taaagtttac taaatttaat  27660

gatatctggg gaatcagctt gcttcctggg gatctggatg tacttgaggt gagagggtgg  27720

ggattcagaa ttatcctttc tatcgcagca tgttctggat tgattcatgt aggtctcaag  27780

tgtgtgtaat atttcatttc tttgtgcaat tttggcatgc cgaggcgggc accctgaagc  27840

tccggcagag cctggagaca gagtggggag ctctccgctc tttcccttcc ttcatcccag  27900

ctgacttcga ctggaattga attcatcagc tgctggagag ttgttttatt tgccctgctg  27960

gtggagaggg aggaaaggaa catcatgggg ccaggctttt tttttttaaa ggaaagattt  28020

gatttacttt cccccttagt agcatgatgg gcacctgcac ccgccagcta atcagaagcc  28080

actgtcccct gaatgcctcc gctgcccacc agatcctgac agcatcccac gcgggagcac  28140

tctcgtgtgc ccctggcagc ttctgctgcc tggcagttct ctaaacttgc tggtgtctct  28200

ctgcccggag gctcagaaac ccagaggact gaccacttct tgaggctcat gtccagtttg  28260

caaagagccc ccagcaagca gagaagggga tttttgtacc agcgatatct cttctccact  28320

cctcaacaca ctcctttcca ctctgtctcc tataaacatg gaacagccag gaatactcaa  28380

atcctagcct gtcatgaagc caaaaattga tagagatcta ctgtccagaa tgatttctta  28440

tagtgaccct gtgtttagtt ggtaagactt tcttaaacca tgagggattc tggtcccaca  28500

gggcagtaat atctggggca gagcctgaga cttttctcat tgatttcctc tgtgagccag  28560

gagtgactgc tctgatgcag ggtgctgtgt ggttggtaga agctggcgtt atcccatttt  28620

acccacgagg aaacaaatga ccagtggtgg agcgggagct cagcatccca tgtgcccact  28680

tcctcctcgg gtggactttt cacctgccca tgccgtcttc tttgcaaact ttactgcagt  28740

gacggagaca tctttaaata caaattcttg ggggaaccct gtgttccttg gctggagcct  28800

ggctgggaag gaggagggag cagagggctc tcttgggtgt ggcctattgc agttgagcca  28860

gggaaaggct ggtccactgg agacaccctc tctggtcacc gcagacttcc tgccctccat  28920

ccagtgtcct tctacttgca ggatgtgtgc ccagcagaga gaatctctga agccatgtca  28980

ttattgggat aacattcctg tcccagtcac cttatttctc agaaaaagga caatgggaaa  29040

caagttttta ttgaatccta tgctgggcct attaatgggg tctcttactt ttcatagcag  29100

cactgcaaac agagttacgt ttctattcat tttatggatt agaaagctga gatccagagc  29160

gggcagatgt aaacctgggg tctttaaaat gcatcctttt tgcaaacaaa taaacttagt  29220

gtattaaaag ggctggagag agcagagtaa ggtaacattt gggtggtcag catgtagttc  29280

tgggtcccca cagtggagat ggcacagtgc tgggtgctgg gggaactatg gtcactaaga  29340

gacactgaat aatttaatgc atgcccctga ttccatcact gactgttgag gtaacacata  29400

catttatatt gtcagtggtg gtgatgatta catgagctgc gtaaagcgtt tgaccagtgc  29460

ctgcacataa catagtaggt gctcaataaa gatcacccac tcttaagagg tgggaggagg  29520

tgaagtcatc tttctgggga gtgttgccct gttgttctct gctgcattct ttctgtcctt  29580

tgggctccga gaatgctggg ttgggcagtg tgagtggtct tctcaggcct ctgtgacatg  29640

ttgctttcat gaaaggttcc cctctagcca aagactgagt ggtccttgca ggctttctcc  29700

tgagtccttt tttttttttt tttttttttt ttaaagacag agactctgtt gccagattgg  29760

agtgcagtga cgcggtctcg gctcactgca accgctgcct cccaggttca agcaatctac  29820

aaaatgcatc tataaaatga tgcatcagcc tcctgagtat ttgggatcac aggtgcccac  29880

taccatgcct gggtattttt ttgtattttt agtagagaca gggtttcacc ctgttgacca  29940

gtttggtctc aaactcctga cctcgagtga tccgcctgtc ttgacctccc aaagtgctgg  30000

gattacaggc gtgagccact gcacctggcc tctctcctga gtccttttgt ttgtgcctgc  30060

tttggggatt ccctctggct ggggtggact gccgggatct gtttgtccag tgtacatttc  30120

ctggtcacct agcaccggcc agctgcggtg ctgggaggaa cagggcctgg ctctgggagg  30180

cagctgggag agtcaggaag tgaagaaagt tcttgtgggt gtgatggtgg aaacccaagc  30240

agcgtccaga gggagcacaa gagggaggga caaatcttgg gagggtcccg ggccaatggg  30300

acccagtgta agaaattgca cctgtcctgg cagatagaga aggtggaagc agtgaatggt  30360

agagcatcct cactcttctc tctgccagca agcacctttg gggaagtcct cacggacagg  30420

aatgtcgtgt gtcttggctt gagatgtcaa agaaacatgt tggacacacc atggtgacag  30480

agcaggagtc tcttaacccc ggcgtggttg aggctgccgt tctggtggga tctggggtca  30540

gtcaggggtt aacagtcgct cctgcttgcc tgattgacac agtaataaag gcagtgacac  30600

caaactaggt ctcaggaatg tgtcctcgtt agaaagactc actaatggtt gtgggggggt  30660

ggcccatgag tccttctggg tggtggcgag aagtagggga ccctttgggc tttgcccttt  30720

ttggtcatag gacttcactc cacagacata attgaaccgt tgggtttctg cagccaaatt  30780

caaatgtcac caatcttggt cacccctttc atctcttggg tcctctgtaa gttatagcta  30840

tctgatagtt tactgaaaaa taaactgaaa atatgtttta aattgtactt tcgatttaaa  30900

ataatgttta gagacaaaaa aaaagggtcc aatccacttg gagaaaagca ttgtcaaagg  30960

tggttgattt ttttcttttg ctgttttaaa gtggtaagtg gatgagtgtt ttggatatat  31020

tgatttttca ggtgtgcagg cggtcacatg aacagctgac attttttttt ttttcatgtg  31080

gacttcagcc agtcttgaca cctgcccctt aacgaaaagt aaaccatcgc cttgtttgac  31140

agtttaagtg cagtgatacg gatggaggca ggtttacgtt atgttaaagg cttgacaacc  31200

cagaaccccc ctgttggttt ctttgttgta acctttgagc cggtggcctg ctgaaatgtc  31260

acctttgccc ttctttaaaa gcaggaataa taggtggtga gtgggtggat gcctcttaaa  31320

atactggaaa gtgctgtggc ccgagggtaa gctttttaga agtgagtgtg tgtgttgtgt  31380

tgttttaatt aatgaatctt ctgggcctga agataatgag gtcagtgagg gcagccatgc  31440

tgcctcacag ctcaccttag ggtccttgtt gtccagaacg tgcctgacct actggagggg  31500

cctgggaatg cttctttgat tgacgtgggt aggaagacag atgtggcggc ctccatgctg  31560

atgggaggca gctgggaaga aggtcatggg caccatctca ggagtggcag agccacctcc  31620

ccctctcctc accccgtgtg tctggattct tccagctgtg tggtccttct tcctgcctgg  31680

aaatgagcat cctgcagagc tcggctcctg ttcacaccct cctcctaacc ccctactctc  31740

cctctccctt tcatccaggg ctggaggacc agatgggctt tacctgatgg agtgtgcttt  31800

gctgacatgg tgcaaagagc caattcctgg ttgcaaagag gcagctgggt gcagaggcgg  31860

ggtgcattcc tgtaataata ataacttgtg tttttataat actttacagt ctaagtactt  31920

ttcaaatact tgacctcatt tagttctcac cacagccctc tgaagggata ttactattac  31980

cttcatttta tagatgcgtt aaccagggct tgttttggga ggtagagggg gtgtgagggg  32040

gacagagggg agggaaccag tgttgaatga attctgaggc cctgccaaag cagccagcta  32100

gctaggtgtt gtttaatgga ctctttgcat ctacagaatg agggaggtgg gatgagggga  32160

aattatttca caataactga aggtcggaga gactaactct ctgctcattg tcacacagca  32220

gttgagtgcc agctgggatt tgtcacccag gtcacctgac tcctaagccc tgtgatcgtt  32280

ctcttctgtc tctagtatac ccagcataat gcccggcaaa gtgctggcat caataaatat  32340

ttgtcgaatg ttaaatgagg cttaaagaga accattcatg cttggcacag gggcacagtg  32400

agacaaacat gtttcctgcc ctcgtaacct tcgcttccaa attctgtgac cttgggcggg  32460

ttgcctgagc tcttttccag ctcagtttcc tgaaaactca tccggaaaat gggtaaaata  32520

tcagagtgca ttctgtatgg taagactgca aatgttagat gattctgcta cttattattg  32580

ttttcttttt ctcaccacac accttccctt tttatgtaca cctcctagga agtaagtttc  32640

tgataacata ctgcattgtt ggataacagc aacaaaaagc acttcctgac attattgccc  32700

aaatcaccaa atgaggcaat taccaacttt ggaataagaa tagcaacggt ggtaagagct  32760

gacatttctt gagcgcttgc catatgctgg gtgtactact ataagctgct gcctgcaatt  32820

atgatttggg aacaactctg aaagtagtta cctcccattt tatagaagag taaactgagg  32880

ttcagagagg ttaagtaacc cccccagggt ctctcaggaa gtagttggtg gcctgggatt  32940

caaacaccag aattggtctg acttcccact ctttaaacca cactcaaaac tgaactctcc  33000

acgtgtgtgt gttctgggca ttttcgcatc tcccttggct tgttgacagc gtggactttt  33060

gctttcccat tctcatagaa catggccagt gcaggaggag gaaatccaca ctggtctttg  33120

gactgaacca gaggctggcg atggtcccga aacagggtgc caagtggctg acccttgttt  33180

ttatgccttg cgctggtaag cttggggcac caggagttct ttgaatttct ctttcttgac  33240

tgtccacgcc ttctttaggc aatcttttaa caggctatgt tttaaatctt attgacatct  33300

ctgaagaaag aggaggaaaa aaaaatcaag acatggcctt agagaagtga caggttttct  33360

ttgagatttt gttttctgtt ttccttttta ttttgtgcac attgcaaaac ctctttggga  33420

tgatgatttc gtgtggtttc ttggtagccc ttgggcagct gctgccaggt ttcacccaaa  33480

tgcattgtga ccccctgttt cgtgggacgg ctttgcctcc acatggctga ttgtgctctg  33540

tgtgtccgct gtgggcagag tgtgattgta agaatcagaa ttctgctggg cttgcaagca  33600

tttaaaaaat ctctataagt ttgagaactg gttggaaggg agagatgcag cgacttagaa  33660

cacccggcct gcagctgagc ttccgtgtgc ctgggaggag cccatatgga gaaacaggaa  33720

aattccactt caccagaaag ctggggaaat gagtgggagt aggggccagg ctggttaact  33780

aggaagactt ttggtcactc tgctttactt agcctaaagt gttcatttcc cccttaagcg  33840

gtggttaata cgcgtatctg cagatttact ttttggatga tttaaaatct tgcaacatct  33900

caagggattg tatcctgatg atactgatta tattaataac aagataatag cttataatat  33960

aatagctagc aattaccaag cacttacctt acaccaggta caatgccagg catttgatcc  34020

ttacacgaac tctgagagat ggctgtttgt attcccattt tacagatgag ggaagctgtg  34080

ctgagagagg tgagttcatt tgcccaagct cacccacttt gagatggtct gcttttatat  34140

cctcttagcc caattctttt ggatgtcagc acttggcatg tattaggcac tggataagtg  34200

ttttgttgaa tgaacaaaat gatggaactt ggatttgaac ccaggtctga gctggctttg  34260

agtcttcaga atagtaggtc caattagtgg agtgggggct cagtagtcca aagggaaagg  34320

agcaaggaga cattgtgggg gccgagaaga gggcttctgg ggtgtttcct gggcacattg  34380

gcattaaagg catagtgtga agtgccattc aagaccatgt gctggattag tgtttttcct  34440

ctccacttga ggtgcttgcg attggctttg tgccccggtg tctgcaaagt gagttgggct  34500

gaactcagga agaccttttg gttgggatga ctgtgtattc acctgcacct gagtagggac  34560

tgagtttcac ttgccagttt taccgcagca agacctcgtt aagttggctt cctctcattt  34620

aggcatttgg gaaactttag gcggctggag tttaattctc aaggcaaagc cccttttcaa  34680

gggacatgaa gaaaggcaga gggatatatt taaaatacct gaatgaactg tttctttttc  34740

tttttatttt ttgagatgga gtctccctct gtcacccaag ctggagtgca gtggcacgat  34800

ctcagctcac tgcaaccttc acctcccagg ttcaagcgat tctcctgcct cagcctcccc  34860

agtagctggg actgcaggtg tgcaccacca cacccagcta atttttctat tgttttattt  34920

tattttattt attttttaat tttttttttg agacggagtc tcgctctgtt gcccaggctg  34980

gagtgcaatg gcgtgatctc ggctcactgc aagctccacc tcccgggttc atgccattct  35040

cctgaatcag cctcccaagt agctgggact acaggcacct gccaccacac ccggctcatt  35100

ttttgtattt ttagtagaga tggggtttca ccatgttggc caggtctctt gaccttgtga  35160

tccgcccgcc tcggcctccc aaagtgctgg gattacaggc gtgagccact gcgacttgca  35220

tgtagacagt aatggcaggt cactatcagt gggtctgtta atcaggtgtc caacctggtg  35280

ctgggcttgg tggctcatgc ctgtaatcct agcactctgg gaggccaagg cgagtggatc  35340

atctgaggtc aggagtacaa gaccagcctg gccaacatag taaaacccca tctctactaa  35400

aaatacaaaa attagctagg catggtggga tgcatctgta gtcccagcta ctcaagaaga  35460

tgaggcagga gaatggcttg aacctgggag gcggagattg cagtgagcca agatcatgcc  35520

actgcactcc atccagcctg gacaacaaag cgagactctc acaacaaaac aaaacaaaca  35580

aacaaacaaa caaaaagtca cttgcttctt tttttgcttg cttatggaca taaaccctgt  35640

aaactatctc atacatcatg ggagtgagtt tgcagtgggt agactgctat tcacaaactc  35700

atatacatcc tatgaaggag tacaggttaa ataaccatta tccaaaatgc ttggggctga  35760

aagtgttttg gatttttaat ttttttcaga ttttggaata ttcgcatata cataatgaga  35820

tatcctgggg atgggaccca aatctgaaca ggaaattcat ttatgtttta tataaaccct  35880

tttttttttt tttttttttg agacagagtt tcacgcttgt tccccaggct ggaatgcagt  35940

ggtgtgatct cggctcactg caacctctac ctcccaggtc gaaacgattc tcctgcctca  36000

gcctcctgag tagctgagat tacaggggct tcccaccacg cacagctaat ttttgtattt  36060

ttagtagaga tgaggtttca ccctgttagc caggctggtc tcgaactcct gacctcaagt  36120

gatccacccg ctttggcctc ccaaagtgct gggattacaa tgtgagccac tgtgcatggc  36180

cttatataaa ccttaggtaa ttttatacaa tattttaaat aatttttgtg catgaaacag  36240

agttttgact gcattttgac tgtgactcct cacttgaggt caggtgtaga cttttccact  36300

tgtggtgtca aatttcagat tttgaagctt tatataatga gatagggtct tgctctgttg  36360

cccaggctga agtacggtgg cacaatcaca gctcactgca accatgacct cctgggctca  36420

agtgatcctc ccatctcagc cacctgagta gctgggacta caggcatgca ctgtgactgg  36480

attttttttt tttttttttt ttttgagacg gagtctggaa tctcaagtct cgctctggtg  36540

cccaggctgg agtgcaagtg gcgcgttctt ggctcactgc aatctccgcc tcctgggttc  36600

aagtgattct cctgtctcag cctcctgagt agctgggatt ataggcgtgt gccaccactt  36660

ctggctaatt tttgtagttt tagtagggtc ggagtttcac tgtgttggcc aggttggtct  36720

tgaactcctg aactgaagtg atctgcccac cttggcctcc cagagtgatg ggattatagg  36780

catgagccac cgtgcccagc cttggctaat tttttatatt ttttgtagag acagggtttc  36840

gctatgttgc ccaggttggt cttgaattcc tggactcaag caatctgccc accttggcct  36900

cgcaaagtgc tgggattaca ggtgtgagtc accgctcctg gcctgaagca ttttggattt  36960

ttgggttaga gttgcacagc ctttactgtt attatcctga tgttattatc cacattttac  37020

aggcaaggat ctggaggcgt agagaggtaa aatcattttt tcaaagcccc agaagtacta  37080

agccgcagat tctgaatttg aactcaggca ttctgggtca gaattagtga ggttttaagt  37140

taattttttt ttttttttta gatagagtct tgctctgtta cccagggtgg agtgacagtg  37200

gtgctatctc ggctcactgc aacctctgcc tcccgggttc aagtgattct cctgcctcag  37260

cttctagagt agctgggact acagacatgt gccaccacgc ctggctaatt tttgtatttt  37320

tattagagat ggtgtttcgc cacgttggcc aggctggtct tgaactcctg acctcaggtg  37380

atctaaccac ctcggcctcc agaagtgctg ggattacagg cgtgagccac tgcgcctggc  37440

ctaccccctg tcgcccaggc tggagtgcaa gtggcacagt ctcggctcac tgcaacctct  37500

gcctcccagg ttcaagcgat tctcctgcct cagcctcctg agtagctggg attacagata  37560

cccaccacca tgcctggcta attttttttt tttaagtatt tttagtagag acagagtttc  37620

aacaagttgg tcaggctcct cttgaacttc tgacctcatg atctgcctgc ctcggcctcc  37680

caaagtgctg ggattacagg catgagccac catgcctggc ctaagtttgg tttttaacca  37740

tgctgctttt tctagaccct tctgtcagcc agctccacaa tggtgaatca gggagttagg  37800

tccgtctgta agagagggcc caggagctgg gtcagatagg taaagagaca ttccttagtt  37860

cttatcctct gctaccaagc catttcttgg gatcaagccc tctttggcct gtgtcattcc  37920

acctccatta agttcagcct tctttccttc tttccacatc tttccactgc tgttgaaaac  37980

ttgagacctg aaatcccatc tcctgaattc ctgggagctc tagaagtgga gatggccagg  38040

ttctgtggtc agagctggtt gggattacaa ataaaccaaa gcctgggaaa ctttcttgct  38100

attaatagcg cagacctttt ggggagggaa tacccaaact cgatgctgtt ggaattgatt  38160

ttgcctgtct agatgacata ctaatgagct aagtggttag cttcggatca ttattgctct  38220

ttcccaagcc aagttctttt aaagactaaa accacaaaag cagagaacga gttgggttag  38280

agaggcatag tggctgggtc cagagaaggg agagtggtca gccctggcct taaacatgag  38340

aaaataaagg tggtccttgc tttggaatga gttagtggtg ctgactaatt caactggttt  38400

ttctttttct ttttggaagt ggaatttgat ttggtgtctg gattttgata gggccattta  38460

tatttcttca gcactttttg gttcttgcag aaagttacat tcctagttcc tcaactgctt  38520

atttcttttt ggtttttgaa gcaggaattt gatttggtgt ctgggttttg ataggggtgt  38580

ttatgtttca tcaatgtctt ttggttcttt cagcgtttct ctccttgtct gtcatgtgtc  38640

agagagggtg cctgtcaacg attctctctc tccagggaga aagtctttct taaaacagcc  38700

ctaagatcct tatctcctca aatcacccac tttgatgata atatccattg ttctcttctc  38760

tgcttcttgg catattctag tcagtctatg tatacaatta aaaaaacaaa acagccctct  38820

gtgtccaaag tgcttggaat atcccagtgt ttcacaggag actttggaag tggacaaaac  38880

tgtatttcct tccccaaatg aggttattgt gctcgaaata tctcctggta gtttattaaa  38940

ggaaaccgca ggcaggggta agagaggcag tttctacagc ctgcaaccct attatcttgc  39000

ctcttctttt cgaccctcct tcctccctct cctcttctct ccccccctca ccctattcaa  39060

cccagcccca catgtcatgc cgtccccagg aggtagccct gcagccctgc ttctctggga  39120

tggtctgttc ttgccacccg tcccatggaa cgtgaagaag gaatttgggg tgtggacttc  39180

cttgagtgac taggattaga cccgtcgggt ctgcagtcag acgagaagcg tgtgggcaaa  39240

gggaactatt gtgtgaggct tctctggaca gaaagcctgc cttcatcttt tactgtgcct  39300

aatggacaat tgagacattc agcttatgtc tgaaaggaaa gtgggccggg atggtctagc  39360

agacctccca gatgaaggct tgtaggagga gcaaatagag acaaggatta ccaacagggg  39420

gaacaactgg ggcagagtcc tgggagagaa tgtttatttc cttgctctct aggagggatt  39480

tggaaagagc cataatcctg ggttaggagt aatttgttac agcaagatga tacttgagtg  39540

acaggctgct tctggctgag gcagcaagac ttgcatgcag gggggtcgtg gggcctccag  39600

aaggtcagcc tcccgtaaat cttcaccctg gctttggggt ttgttcctcc ccaagcaaaa  39660

ttaaccagag gcactgctga cctttgggct tcctgggtgt agcgttacga agcatctcca  39720

catgtttgtc acagctagaa tttgacaata aaaatttgga cagggagacc ctgccagagc  39780

cactgacctc tttccaatgt gacaagggga aaaaaaacaa aaggaaaacg cagcacgggg  39840

tgcggtttca gttgaagttg gaggacacgg agcccagcct gtctcgcatt tgctgtctat  39900

gtagactcac taaagcaagt taattcattg ctctttgacc gccaagtctt tcgttgtctt  39960

ttgttgttgt ggaatggggg aaagaaatac agaatgggga ggagaaccta attagaaaaa  40020

tcaagccttg agagctccca gccatggaga aagaaaggga ttttttagaa gttgtgattt  40080

taatatctgc tgcaatctga tgattcatgg atttaaaata acccttccag gtcaccagga  40140

ccctgttact tgctggcttt gtacctctca aaggtcattt gttggcttcg tctcttaaca  40200

atttccatgg tagacctaaa atttctggct gtgaaatccc ctgtgtagtg ggaagaagaa  40260

atagcaaatc ttagctgcct tggacctgat ataattattt gtcttcattt acatggttta  40320

tccttcaagg ttgaataaat gatgtgggag ctagtcaagg ggctttaggt atgtgatttc  40380

atgcctactt ttttttaggt agagaaactg aggtcacagg gtactagaga atggactcta  40440

agattcaggt ttctgaattg cctgtggttt tgttgactca actgctcttc tgttgttttt  40500

tagccacatg ccttgaaaca gtcctctttc ccatgtttct tcatcagcac cattaaccca  40560

aggtatactg tcctctctta tctttcacaa ggtcttggag ttcccatgcc tttgtaagca  40620

tccctccccg agattcagca ccaaccaaaa tcacatttgg aaaaattgct tgtttcccaa  40680

gaagctttgg aggatatgat tttgtataga acgggttcac aggttttctg ttcattcttc  40740

tatggtggag tgtgtgtgta tgtgactctg tcttctctcc attcctcttt tttttttttt  40800

ttttttgaga tggaatttcg cttttgtggc ccaggcttga gtgcaatggc gtgatctcgg  40860

ctcactgcaa cctccacctc ctgggttcaa gcgattctcc tgtctcagcc tcgcaagtag  40920

ctaggattac aggcatgcgc caccacgtcc agctaatttt tgtattttta gtagagatgg  40980

agtttcatca ctttggtcag tctggtcaca caaactcctg acctcaggtg atccaaccgc  41040

ctcggcctcc caaagtgctg ggattacagg tgtgagccac cgcgccaagc ctccccatcc  41100

ccttttatct cttaaatgaa tgtggtcacc atcaaagatg gtgcctgact cttttttgtt  41160

ttcagttcat cttaaattca catataattc acacgtcata aaatgtaccc atttaaggtg  41220

tacagttcag tggtttttta gtctatttag tatatttaca agattgtaca aacataccag  41280

tatcttaata tttttatcat ccccaaaaga aacactgtaa ccctagcagc cagtctctac  41340

ccgccttccc catagctcct ggcaatcact aatttacttc ctgtctctat gaatttgcct  41400

attttggtta tttcatataa aaagaatcat acaccatgaa actttcttca tctgccttga  41460

agttagcata ttttcaaggg ctaccatgtt gtggcatgtg tcagtactcc atttgttttt  41520

attactgaat agtattccat tttatggctg taccgcattt tagttatcca gctatcggtt  41580

gagacttggt gcattcttat cccagaacat accatattca gctcccagtg acacccacat  41640

tcattcctgg gctgctcctt gtcttccagc tattttcctg gtctcctgtt gcctctgcct  41700

acttcagcat gctgtagaga catgggtagt aactaaaaca ttccaattaa ctgcattgta  41760

cttggccttt ttataagaag cagtaattag aaaatatggt ggccacaaga ttgatattaa  41820

agtgaaagat tgtaaatact tttctgcctg aaggtagatg gcctctggcc tgcctcttag  41880

tgggaggttc ttccaggagc ttgcaagcat ccattatttg ttagtcatca gcttagcggc  41940

caaggagcat tagcctgtct tgctctgtct gctgaagact ctgagagaca tgggagggca  42000

agggctgctc cttttgaatt cttccaatgt cttcatgtcc tttaacctcc tggcttaggg  42060

acttgtgtgc tggtggtgga gctgacattt gtttggaatc cacagccctt tgggtgggac  42120

tcaatcttgg ggttgcctga agactttgag atggctaggt ctgggcctct tttggtcact  42180

atggaacaag actgtctcag aggccagagt ctgtctcacc agctccctgt cttgggactg  42240

caccattgca gggtctttgc cctcccctgg agatttctct tcctgcctgg gcacccattg  42300

gccattctgc ccgtaagctc agtagggtgt aggcaaaaga gttctggcct ggaagtacca  42360

aagtcctgcg ttctggtttc agtccctcat aactgtgtat aactaagtca cttagttttc  42420

tgtgcctcac tttcttctgt tttaagatgg atttggagat tattggcttt gaccacctaa  42480

aaaggatgta gtgacaatca atttagaggt ctaaaagagc ctttgaggaa gtaaaatgga  42540

atcttcaaat ggactacatg ctgattattg acactgccct agcactgata gttgatgttg  42600

actgatggtc agaattgctt ggcaagttgg aaaaaagtac gtacagatcc tgggccacta  42660

ccaagtttca tttaacagat ctggagtgca tcaggaaaaa agtccctcta aacaagccag  42720

caaggtttgg atactgtgca accttttttt tttttttttt ttccttttga gatggagtct  42780

ggctctgttg cccaagctgg agtgcagttg cacaatcttg gctcactata acctctgcct  42840

cccaggttca agcaattctc ctgctttagc ctcccgagta gctggcataa caggcgcctg  42900

ccaccacacc cagctaattt ttatattttt tggagagatg gggtctcacc atgttggcca  42960

ggctggtctc gaactactga cctcaaagtg atccgcccac ctctgcctct taaagtgctg  43020

ggattacagg catgagccac tgtgtctggc cctacttacc ttctttgtgt taattcctgc  43080

accattgatt agcttattgt cccattgact gtgtctttag atgacttctc tgggcctcag  43140

aatatctagt ccatagctga cacagagcat ctgtttaatg gtaaatgctg caggaatcca  43200

tgcattggag tagaaagagt tttagatcat gttcctcatt tcttgctaca gacttaggca  43260

aagcgtggag aagaggttgt ccaatgaaga aatgaagtga catgccaggt cagtggcaga  43320

gctaggcctg gaaaataggt ttccagactc ttccctttct accatacttt tcctgggagt  43380

acgcactcgt aatttgaaga gcgacttttg ggagagggtg gaaggaaggc ctgggcctca  43440

gcctaagggg cccattggtt gtgagaggag ggtctggtga aattccatac cgattgtccg  43500

tgtgtgagct gctgtaccat agcctccctg cagaaccact aacctgtcaa atgcagaaat  43560

agttcaggga cagagctgtt aaaggattgg cgggttaaag aaaacagtga atcccaagtt  43620

ttgttaattg gatttttttg tttgttagtt atttgttttg cttcattgtc ttcatcacac  43680

caggggcctc cttaaatctg gtggaaaaat ttccttggaa aacaattcag tgtttgtcca  43740

tagacttggg agggagagat gctagatgct ggaaagtctt gcttattact ttggggacac  43800

tgagatgttc ccttcaccat gtactttgag acacacatcc tggttgagtt caggcaagga  43860

tgcctaacag ttgataagaa aactgggaaa gatagaaggg atttgtaagg taagtcaggg  43920

tgagtgaaaa cacatccggt atgctggaga cctagatgct tgactgccac tcgctcctgt  43980

cacctcagtc aatctgggtc ttgctctgtt ggccttagtt tcctccttgc taacaggtta  44040

gttccacctt tctgcccatt tattttgtag ggttattgtg gatgtcattc tgaactctaa  44100

aataccctct aaatatgaag tgatattagt gctctttaca ttgttatgat taaaaatatt  44160

tatgagaaaa aggttaactg taaggatttc attgaaaatc ttataacaac caactgatag  44220

agatagaaga taaggctatt aaattgttca cacagatgcc ttgatatcct acctttttcc  44280

ccctatattc cttttatgtg agaaatgaga tagtgattta agggaaaaac ttaaaagagt  44340

tccgactatg ttggtttttt ttcccccaag tcaaccttaa tatcttactt aaatcttttt  44400

cttttttatc ttttcttttc tttttttctt ttccctccct ccctcctttc ctcctcctcc  44460

ttcccttcct cctcctcctt ctgctgcttc tctctctctc tctcgtttcc ttttcttttc  44520

tattcttcct ttttcttttg agaccaggtc ttgctctgtt gctcaggctg gagtgcagtg  44580

gcaccttctt ggcttattgc aacctctgcc tcctgggctc aagtgatcct cccacctcag  44640

cctcccaagt agctgggacc acaggcacgc gccaccacac tcagctaatt tttttttttt  44700

ggtagagatg gggtctccta ggctggtctt gaactcctgg actcaagcaa tcttcctgcc  44760

tcagccttcc aaagtactgg gattactggc gtgggccacc atgcctggct tgaaattttt  44820

ctatggcttt attctttctc caagtacaga gtctacccaa ccttctgaga tctttggttt  44880

tcttttccta ggtaactata gtacatactt atttatgtta aacaacagca atcacacatt  44940

tctttttcta tacagtcatg ctttataggc aaataaagcc tccgtcttag gctttctgga  45000

ttttttcaaa agatgcaatt cctggagtat gtttttactt agagcaaagc agcctagtct  45060

cctatacctt ctgcatctgc agaaaagttg gttaaacaga ctttgtaatg atgcccctta  45120

caattctgaa gggacttgtg aaatagtttc acagagtttc agtgttaggt atatttgatc  45180

aatgctaact tttggaaaac tttggtgcct gtatgattca gagggtaggg cagaatatta  45240

aattaatcac aacttcttgt attttaacca ttctgggtaa attgggattc cgtgacgccc  45300

aggcaaaatt atttgtttat agaagatggg ctgaattttc catcgtccat ttctgagaaa  45360

tgaggtaggt ttagaaagag acaatcaggc ctcttcttta acagaaatgt ttgtgtctac  45420

taggtgtgtg tcacaatatg agttcctgaa gaaataagtg tccgctattg ggttgtatac  45480

ttgtacttcc tattttctta ttttgcacat ttttctggta tttccctttc tatggtgagt  45540

ggcttctgat cgtctttcct tttgtaaagt gtaatgatat gagaatcata atcgtggtgc  45600

ggtcttttgt gttgcatatt tgtagggggt cagtatgaat ggcccgtggt gaggctgcac  45660

tgaaagatta ggagcagcca ccttgatgcg gaggaggctt agtgactttg gacatgatgg  45720

gctatggctg gctatactct cagctttggg cgcataagca gagtattgat tttgtatttg  45780

gttaaaacca gaagtacaac tttctggcac cagaggatta ggaaaattta acagcggaaa  45840

gccatcatga ggatagtaac caattaattc gatttttttg gtcagacatg gctcccacct  45900

gtaatcccag cactttggga ggctgaggtg ggagggtcat ctgaggtcag gagtttgaga  45960

ccagcctgac caacatggta aaacccgatc tctactaaaa atacaaaaat tagcctggcg  46020

tggtgatacg cgcctgtaat cccagctact cgggaggctg aggcaggaga atcacttgaa  46080

gctggaaggt agaggttgca gtgagtcgag cttgcgtcac tgcactccag cctaggcaac  46140

agagtaagac tgtatctcaa aaataccata attcgttttg tcttttcttt acttttttct  46200

ttccttttcc ttcccctctc ccctcccctc cttccctttc ctcccctttc cttccctttc  46260

catctctttc cttcctttct tttctctctt tctctctttc tttcaacagg gtctcgctct  46320

gaaccttttc cagtcagaat tgctcaggga tttttagact tccattctgg aaaagagggg  46380

gtagttattt tggtgagatt gtggtcttgt ggttagacct tgtgatgggg gcctcagcca  46440

aagggttcag gatttttttc caagcttttc cctcacaact tgagttaatc cgaaacgttg  46500

ctattaggcc accggacatg cttttctgca tgcctgtgtt gggctgtttg gattgaaggc  46560

ccagcaaggg aaggcaccct cgcccatctg acacaggcag gcctctacaa ttttattccc  46620

taaccagggc atgacaaact atggcccata gaccaaaatt ggcttgccac gtgctttttt  46680

ctggccagtg agttaagaat gactttttat tatcattatt attaatattt tttgagccag  46740

gttctcattt tgtcacccag gctggagtgc agtggtgcaa tcacggctcc tgcagcgtga  46800

aactcctggg ctctagcaat cctcctgcta acttttttta tttttgtaca gtcttgctgt  46860

tgttgcccag gctggtctgg aactcctggc cttaagcaat cttccggcct tggccttcca  46920

aaatgttggg actacaggcc tgagccgctg catccagcac ttttattatt tttaaatggt  46980

tgaaacacat caagagagga ataatatttt ctgacacagg aaaatgatat gaaattcaca  47040

tttcagtatc tgtaaataag cttttattgg agcacagcca tgatacaaga catatactga  47100

ctgcctgtgg ctgctttcga gttacaatgg ctgagtcgag tagttatgac agagattgtg  47160

tgggccgcaa agcctaagat atttgctgtc tggcactttg cagaaaaagt ttgccaaccc  47220

tgccctgaac aaataaaggg acaaattcca cttgccccgt ccatctgtgg agcagagtca  47280

ctgaaaggaa atactggaaa tactggaagc cacttggtgt tttatcaagg atgtgaggtt  47340

tcctggcaac tttgtcgcca tatcatcatc atcatcacca tcatcatcat catcatcatc  47400

atcatcatca tcatcatcat catcatctgc cctttaagtt ttctgcttgt ttagaaaaga  47460

aatttataca gagcccccag tagcagctgt aagggggcag gttcttggag cagcccatcc  47520

tcaacattct tgctgctgat ggaagattct caaggatgaa ggcccctcta tgggagcagg  47580

atcagtctgg ctttagtaga tgccaatttc tgctaagact atttcctaaa ggagcctctc  47640

ctcatttgcc ttttctccct gttttcattg ggggaggtgg aagaggagaa aaataattag  47700

agatgctcac ctttttcttt ttgctggcaa tttaacagtc ttttcagctg ctttgattcc  47760

tttcaggcca ttggtgttgt atatatttca agatttgctc acaggtccaa agcttaactt  47820

aagctccctg agacatatca taaaatatga tttggggaaa aaccctaatg ggccatgatc  47880

agaacattat tattcaacaa aggatgaaat gcttaagcca agatggcctt ctttctttct  47940

ttctttcttt cttttttttt aatgaaagtt gagcagactc ccgtccaaca gttttcaatg  48000

taggaattcc cacagcccca tttgattgca gtttgttgaa aagtttaatg tttttgtagg  48060

caattcataa tttccacatt gaacagcctg agaggaagag agctggagcc cactgttgtt  48120

tttgtagtgg gatggtggga actttttttt tccctccccc aaaaggatat aaaactaagt  48180

cagatggttg ggaaaacgtg gcacagggtt ccagcccttt tgtaaatctg agatgccccc  48240

tcctttaggt cttcctttag gacccaacag aatagaaatt cctgctgctt aatgtctcca  48300

ggaaggaaaa aaattttcct ctaggctgta atagtaccta atttcctttt tcttctcttt  48360

atttatttat tttccctatt aataagcacc aattgtagaa gatgaaggaa gctgggaaac  48420

ccatcacttt tggagaaggt taatagcttc ctttagaaaa tcctgacata atacttattt  48480

ccccaaaagg cacttcatca gcctgaatgc cagttaagat tcaaggaatg ggcttggatt  48540

tgtgtgtacc cagcggttct gtggcatcaa gttgcactgg gaaggagagt ttggggctgt  48600

cactgtggag tccctgcaag tcagcaggac cagggctgtc ttcctgcacc atctggattt  48660

ggttagctct ctctgggcag tggggccgag tctcatttcc tccaacaata atgttatata  48720

ggcaatgatc ctgggctgcc ctaacataat tgaaaattat gtgtattgta ggcttggagt  48780

gctgaaatgt gggctcataa aaatatgtgg tgcaggtagc ctatggagat tggatgtggc  48840

acacaatgaa gcttttatgt aaagtaagaa ttataagtct ccatgttaat attgtattat  48900

gagtatgaca gttcttgggt gggtcctcag ggcaggtctg tcaccttcaa caaagcccga  48960

gtttcctaat tctacagagc tggtatttgg atgtaatcaa atcggttttg caggtggcca  49020

aagatgaaaa cttgtccacc aatccagctc tccccactga gggatagcat gggatgtaga  49080

tgggtttgac tccatttggc atttttgttc acgggttttt atgagatgga gaggtgagtg  49140

ttggtgggtg tccattttgg ttggcctcaa ggaaatgact ctattgagtg gttttgacca  49200

atgcagctca tatagttatg tggtaagtga gaatgggaag aagttgggat gagatggggc  49260

agtttagatt cccagagccc tctggcctgg gttacagatg gagactggaa atatttactt  49320

tagtggttct caacttgaga tgatactgct cccagagaag gtatttggaa gtgatgagat  49380

ggtaaggata accaaggggg ttcctgttgg tatttactgt ctgggggctt ggagtcctac  49440

aagtccttca gtgtttgggg cagactcccc acctaatacc ctgtcgcaga taggacaact  49500

cattcagtac acagatgaaa aaaacagaga tcactgaagc aaggggagtc gatgcagggt  49560

cttgtggcaa gatgcagaca caaccggact aataactagg ttgctcacca cgggaggcct  49620

ctaggtgaaa gctctgaatt tgtagcagac acacccacct cgtatagatc ctagacgtca  49680

tgggaaaatc gactgtgtac tttggcaagt agttcttggg caatgatctt ccagctttag  49740

gtataaccaa atttggtttg aatttgccaa gcagtcgtat cttcgaggaa ctccgtcggc  49800

tggcttgtgg atggctttgg cacttctgtc tctcgtggga tttgtgcaaa cccttctttc  49860

tgtattatcc tttcctgtct tttttctttc tattgaaatt gttctgacca tcaagaccta  49920

actctgtgca gccttcccca gtctattgtc ccagaaattc tgtcatcttt cttggcattt  49980

cctgagtccc tgagtctctg tcacagtgtc accatgttct gtcttgattt acctgtgtct  50040

gtaaggctcc tcatgctggc aaaactcccc gagagcggac atctttgtct ctcctagtgc  50100

ttgtcacagc ctgtacacaa agcaagtagt actcagtgtt cattgagtaa agttttctat  50160

agaattaata ttaaaaccag ccatttattt tgcttgagga ggtctccgaa atgaccaagg  50220

tgtctcctta tatcttatat cccctccaag cattcattaa ctgatggatt agtgagttgg  50280

ccttgagaag cataaaggct cgtctccatg tgcttctaag cattgtgtct aagttctgtt  50340

tggtttcctg agtgaaactg tcttaatgtt accaacagaa gttaaatgcc taagagtttc  50400

ttatacatgg gctgagtacc tctgtgactg ggcaagccac ctcacctcat tttaccttgt  50460

ctgcaaaatg aggaactggg tcaactcatc gttcaaatct cactgaaagc taattgatcg  50520

cttttgacag aagtagctcc cttgggccgt atatttattt cctagcttgg aggaaggtgg  50580

ggacagacag aattgatgta cacctttatt tttatctcta tggtaaacct gtgcatacta  50640

aagcattcct ctggtctttt gagatgagtg tatacattgt gtctggccct gtgcattttt  50700

taccaagaag taagttttgt tgagtaaact tgggttgtat gaagaactgc atgctcaccg  50760

tactcaagta gcttttgcta cctaaaggac agctgctcat atgtacttga cttcctttaa  50820

agtgaaggat gatgacattt gaaaaacgga ggttgaaaag gagcagattt ggaattgatg  50880

gtttcctagg acacttctgg cttgagattt gtgttttact ttcttccttt ggaatagctc  50940

tatattcttt cctctccctc cccacctctc ccactcccct ccagccccca ccaagttaag  51000

gtagtagtaa tgaaatcatt ttttctgaag ctaccctgta ctttgaatgc aaagacaaaa  51060

aatacagttg ctagtaacat taatcttcta tatgtgtact tactgaactt gagctctgag  51120

gaagacccta ttggaattgc atgctttttt atttttttaa tgattatttg catgcttgta  51180

tgtttttcag tttctgaccc atgtcacagt tatttcttgg gctagttgtt ctgcatttac  51240

tttctgaatt cattgttttt catttcactt ttgtttcctc tcgccagtat ctccagatga  51300

aatggccact gcttgatgtc caggcaggga gcctccagag tagacaagcc ctcaaggatg  51360

cccggtcccc atcaccggca cacattgtcg taagtaacct cccagagatg atggcttcct  51420

ttattgaggg ggtgaaaaag aaaatgcttt tttgatgata acaggcctta tttgtcattt  51480

ttttctttct ttaaacacat tttctttgga aatattgttg ggtatagttt atatctataa  51540

ggtattcatt ttctgctatt ggaccttaat gattgtaacc tacctggaaa ttttacaaac  51600

ctttcctcca ctcttttcca tgtatttggt taaaatctag ccttgtgggc tctagtttat  51660

aggacacaat caccatggta tggaggagac tagaggtggt atcaaagcag ttataaaaat  51720

acattcaggg caggtgaagt gaagaagagg gaattagaaa actcaaaagg gggtcctgga  51780

tttgaaactt gcctattatc ctctccccca atttatctta atatttgttg gcaacattct  51840

acactaacat tagaaaaatt tcatctgggc tggctgactt gtaaacctag agtagaaatg  51900

aactttgaaa ggctaaaatg gaatttaatc tatacatcca tggctttgaa agtatgtagg  51960

tttgatagag aaagcatttg tttttagtac taagagacta caagtgtgtg tctacatata  52020

tttttaatgt attttcttag ggttttgtag gctctaagag tggaatttat aaattaacct  52080

cttgagaaga tagctcagcc ttatttgaag attcccttct atgtatttat atcatgagct  52140

ggacttcata cttttgaaat aattaatgga aggcatattt ttataatgaa tccatccatg  52200

acaggtagaa ttatgcaaag catgaatcaa tcatgggttt ttcatttgag tatcacaaaa  52260

tgttaatcat aaatacattt tgcctctata ttgtaatttc taaaaattgc aaaataagtt  52320

tcttaagtag aaaaatctta agatgcattc tgccattttg ggctaactgc ctccttattt  52380

tggagcttgc tgtaattgag catgtgttat ttaatgagtt atacctctgt catatgtgtg  52440

tgtttatatc acaaaataac ttatttttat aaaaccatat tttgagtcat catttgtgac  52500

aatgtcttct tttctctggt ataaatgagg catgtagaaa gaagattgac atttgctaga  52560

agcttcccct ttcctctaac tccacaataa aatggatgct cataattaca tctgctccta  52620

taaggtcaag atttcagggc tggaagtgac cttagatcat ttaggcccaa cttgccctca  52680

ggaaaggaaa ctgaggccca gagatgcctt aagtgaattg cccaatgtca cacgctgagt  52740

cagtggccag agcaaggctt ggatccagtt ctctgctccc tttccagagc cttgtgatgt  52800

cttctctcct acaggaggtg aaaataactg ctgtggctgg ttctgttttg ctgactgtaa  52860

attgggtcat ggtcagggac agtgcatagg tgtaaagaag ttgctggttg ggggttctaa  52920

tgcaggtttc tccaaaagtg aatgccctgt taaaaaaaaa ttcttaacaa atatacagag  52980

attttttttt taaaaaagtg tgacagttct agacacctag agagtaaagt gaagaagcct  53040

gttttcaggt ttcccgcctc cctgaatttc ccagcatggt ccaggctttg aaatttattt  53100

atctgctttt ggcaatggtt gatgggaatt tcccacattt attttttagc tacagagaaa  53160

ggacattatc tttaaaatct cttcgttgtt ctctctcttt gagtgaggag agaagatgtg  53220

aatcctggca gtggttcaga gtggacacag cccctgtgtt tgtggcatag gctctgtggg  53280

ccccatgcca gggagcagta cccccgtgta aaggagtggg ggtttgtcca tttggataga  53340

gcaaagatcc tccacctcaa atcccacaag aacagttgcc acaacctggg ccctaagcat  53400

ctcattttcc tatgtagaaa ttaatgatct ggaggagatg gcaaaacatt ccttccagag  53460

cctgtgtgga ttttggccag gggtgcagca agggggctta ggcacctttt tcctctgctg  53520

tgtcttagca ggcgtgttga ccatagcaac tcccctgggg catacacacc ctcttgtaga  53580

tggagacctt tgtccaaagc agccacagct ggcaactgtc tacaatcttt tgggctttct  53640

gctgtgctca aggggatctg ggaatggcca ttgcctagag gggatgggct ggtggaggaa  53700

ggtgggctct gggagccggg gagaagggaa aagccatgaa tttggacaaa aggacaaatg  53760

tggtttacat ttgtgaaata cttgaatgct tgtcatgaat ggtgactttg gttctatgag  53820

tcagccctgt gatggggtat ttctgcagtc ttcacctgac accaggggtg agaaggagga  53880

tttctgggga ggaggaaaga gttgagggag ataggaaagt agagtggaag aaaggccttg  53940

cgttgttgac ctctatccac ctggtcacct atagtttttg ggattgagga tgcatacacc  54000

ttgagactac aaatttatga ttatattttt gctgaacata aggcaatgtg ccaaccaaaa  54060

ccagctgttc tttggctggt acagtgtgtc tttgtttgta aagggtgcat tctgaatggt  54120

ggctgataca tcatttgggt ctttgtacag ttaaacattg gccagagggt ctggttcgtg  54180

tttagagtcg ccgatgaagg gctaactttt ctccagacac ttggggctct tgttcacact  54240

ttgcttttca ctcttttaag taagacatag tcacatcaca gtgtttcatc agacatgttt  54300

caaaataatt gtctaaggat tgcttcttaa tttccccgaa atttggaatt gttgtaactt  54360

ttgggccaag ctatttcata attatttcta atgtctcgct tgaagaatag ggatgtattc  54420

agtgttgatt attaatcatt cgaaactaca actttacaga ttgctaagaa gaataacttc  54480

ttccagtacc catatggggc agaatcttca cgtgggaatt cagagcattt tgttggacta  54540

ttttaatctg attggattat tttcatgtgg tatgtgggtt accacattag aaacgattga  54600

tgtgtagaat aaatgttctt aacaagtgga ggtcaactta tcaaatgata tttacattaa  54660

gaatagactc cacaaatttt agttcctgta gctgatatag catctcattt gttatataat  54720

ccagtgattc ctaatctgtg ttcagaggag agaggaaatc gattgcaaca gggacgatgc  54780

cttcattggc tggcccaaaa ctgggagttt atacaaggcg tcagtctttg ccttcctcct  54840

ccctgccttc cctcttcctt cttccttccc catactcccc aacaaattca tggacttctt  54900

aacaactcag agacattagc cacaagttcc aagacacccc caccccccag cctccccagt  54960

cctattttcg cattcatata actaaactct ttttctttct tggtggagtt ttgaaattta  55020

tatttttaat tctttgctcc cttttttcct cttacaaaat gagtgccaag cagctaagtt  55080

gtgctgagtg gtagagtttg agtcagtctt ggctggtaag ctgtggggtt aggagccgct  55140

ccctggatac cacctctggt gtctttgcta tacaaagact ttcatttagc ctcctttgta  55200

tccagcaaaa aaagattcag tacccaaaat ggtggtattt tggtatagta tgtatcttac  55260

aaaacggcaa aagacttcaa aagttcctac aattttatct tgggggtttc cttttgaagt  55320

cgatgtagaa ttttaccttg gggtggattt tttgtacttc ttggtctggt gtgttttgtt  55380

gtgtaatgag catggaggtg tgggataaga aagcagactg aatcccgagg aacaaagcct  55440

gccagactgt ggtggtgtac ttttcttgtt gttattgctt aaatgctgca agagagtgga  55500

aaactcttac gaaataatgc acgatgggta gaacttcaga gaaaatctct gccgtctacc  55560

ctgtgcattt tcgaggaagc tcagagggca tgctgaacct ttgctttttg tttctgaaga  55620

gttcagggga acctacccat aattaatttt ttaaaacact acctagagag caccctcttg  55680

gttattaaac acatgcgctg tttcgatggg atgtttgacc tggattgtgg atgcttgctg  55740

ggacgtggca tgtgttggga ggctctgtgc tgcctgctga gcaccagcaa agccacagtg  55800

gcccctacct ctgtgggagg ccctgtgcca ggtgccctca aagagtaggg ggcccatgag  55860

ggtatgacca gggggacctg atttcggctg agaagttggc ggggattaca ggcctgggcg  55920

gctccctgag gaaattgcat taaaaatgag atctgaaggc ttgattgggg ttggcccaat  55980

gaagggatag gagaagggat ggggagtggg cagaaggaaa cacatgtgtg aaggtcctca  56040

agggaaaagt gcttggcttg gacagaggca ggaaatcagg taggaggcta gaggtcgggc  56100

agggctccgg gagagtgact tggggtgcag catatggtga ggatctgaca ctggggagtc  56160

atttgagcag gttggctgtt tctgtaggag cgtgtgttaa gctgctggca gtggggatgg  56220

tgaaaataga gatgtggagg aaacagcagc ggaacttgct gacaggttag atattggcat  56280

tgagggagaa aggagagtca aaggtaggta gatggagatg cttcactgag tggggagtat  56340

tggaggagga gcaggtttgg ggtggaagcg ttgtcctttt agagagattg tatttgccat  56400

tgattgattc attcattgtt tctgcaaata tttagtgtgg gaaaaagcat gctagacacc  66460

aagagagagt ggagtcaatg aagaacgata acagcaacaa agactgtagc gcttcctatg  56520

cgaggcttgt tccagttgct tcagaggctg tgttacccct gttctagaga ggaggaacta  56580

ggcccaggga ggtggggatt tgcccagtcg tgggagtcag gatgtgaaac aaggcaccct  56640

ggctccagag cacaccgtcc tctcaaccac tgcagagaag ctgggaaaga gacaaataag  56700

tgggtgctta gagcacaatg tgtgtggtgt gccaagagca gctgggagcc ctgggacccc  56760

cagggaaccc cagccccacc tgggcatggt gggcatggct ggaggaggcc tgctggcttt  56820

gctggagagt gggacatgca tcaaggtggc cagagactgg gcttctgggt gtcgtgctgt  56880

gactgctgca aagggctcat tgacatatgg tggggagggc cagcgtattt tctgcgggca  56940

ggacatttgg gggatatggg gtgtgaccct gtactatcta aaatctttta cttctggatt  57000

atctccactt tctctactgc atatatactt tgtttttatt tattttattc atttatctat  57060

gactcagcca gactctctaa aagagttgac ttgtgtttcc tagcagccac tgagtcagaa  57120

ctttcccatt tcgcagtcag ggctgtggtc agggtgtctg tgttgtctaa ggatataaag  57180

caagccttcg ggcactacca aaacattatt ttataaggag aactatgagt acctaatagg  57240

aagaaccagg caatcaggtt atcttttggt gaggaagaag tggtagatgg gatcattggt  57300

gctttgaagg gagtgggtgg tgtagactcc aaagtgtaca tggggccatg atagagtcta  57360

tgtcagatgt ccaaagcttc cttctctcct cccagaaact ctgtcctctg gtgaagagtt  57420

ttgaagtttc ctgaggtttg ggttcatggt gtggcaggtg ataccatggc aatagaaaat  57480

atcccatcaa gaaggattgt gtgacctcag ttgtagcccc tgcatgttgg aatcacaaca  57540

atttgcaggg ccttaaaatc aaatgccatt tcaccaactg ccctcccccg tttttttcag  57600

cactgtttgg tagctatctg tttcccctga tattcttgga cacttccaga gatgggggct  57660

ctatctcctg gtggtagact gtttcttttt ggtacaatat gaactcttaa gagagttcta  57720

cctttaggga gctgcagtct ctctcctgga aatgctcaac tccttaattc atgttttgct  57780

gttaaattct gctaatgcct caccttacat gtcttgacaa tttgaaggta gctattgtat  57840

tccccgcaac cccaagtctt ctcttcaaaa tgattattaa ttgtaattca aatcatcagt  57900

gactggtatc ttagactact taaggatggg aattgctaat tttgtattta aaagttgtac  57960

ctctaaagta agtgaaattt atttttaaac gtagctttct tcattcataa agtttatgtt  58020

cattgtaggc agtttggaaa acagcccata atctcaccac tcggagatta cattgtgaat  58080

aatttggtat atttcctttt agaaatatac caaattatcc ttttttcctc tgagtgtatg  58140

aatatttata tttgttttta acatacttga gctcatagtg ctcagtattt ccaacgttct  58200

gtttatttaa gatgaaaatt gctgtagtta ataagcactt ccccatgtca ttaaaatgct  58260

taaggatttt taatgaccac ataacagtcc ataatatgat taaaccccaa tttactgaat  58320

caatgccata ttgttgggtc tttagattgt ctccttttgt ttctgctact gtgaatgatc  58380

ctgtgatgat catctttgtg tgtaaatctt tgtcccctcg ccccctcccc ttttattatt  58440

ttcttgggat agaccccagg acaaaaggta gaaaagaaca aagtgttaaa aaatttcttg  58500

atacatagcc acagattatt ttcctgaaag ttctcaacat ttataactac gagcagtatg  58560

taagagagtt atggttggaa tgattttaat gtctctgggg aatttaacaa caaaaaaact  58620

ttaggcttct ttggagagag acatgccctt aactccaccc cgccctagaa cagagaccca  58680

gcccatccaa gtcagcctcc ccaggtcctc caccttcaaa acaggcaaac gaaatcattt  58740

cttgaataat tggtaggctt caaggtcaga tgtttatttt agataattca cagcataaat  58800

ttatatgttt taggtacctt agcccctgaa tatactcagt tcatttagga ctattttaga  58860

ggtcttgagt ttactcttat aacctcacat ttttttgtga atttttagtt ctattatctt  58920

tgttttcatg gcatattatt gggcaaagat actatttatt cgatgctatg tgtgagctgg  58980

gtcaggatta tgaccctgag ttatgtttct gggaaaatgt acccacttgt caaagatgcc  59040

gttggctcct gtgattaagg tcagcccaca atgaatgtgg ggagggctgg cagcctctca  59100

aatcagctct tgaccatttc tcaagctggg gcctgttgtg cttgggggaa gagtctttgg  59160

cagctcagct cggggctagc gtttcctgac atttgtttcg ctgaatgtta acaaggttac  59220

tggaaaaaag ggttctctcc taaaataggt ttagggaagc actgggatat gcgaagtgaa  59280

tgagtttctt tagggcagga tcttgactct gcagggggct tggaggcctt ccctagagtg  59340

gggcttccta acactgcaga gctcttccca ggacgagggg caagattggg acctactttg  59400

gaaggttgtt tttgtttcgg cacctgctct gtttacgaag cgtgggagcc tgttttaaat  59460

taatgtgcgc ctacttagag ctacactcat ggttttgact atgtttatct ttccagtaaa  59520

taaaacaaaa ttgttcattt ggcacccagc ctgtcctgct tgtcatttct tgtcttgctg  59580

attaactcta tggatggggc atgtttctcc aaccagattg taagtttctt gaagccaagg  59640

agccctgtgg ttgatttctt cacatgtggc tctctctcct cccacaatgg tgcttcgtta  59700

attaagcaga aaacccatct ctggttaggg actggagttg atttcgtttg gaatgagtgt  59760

gacttcatca tgacctgaaa gtgttcagaa ccatcttggt tagcacaagg gcgtggacgt  59820

gtgtctactt tctacctgat gggatagcat gtttaatttg gggttatgac actgaatggt  59880

ttgccagtaa cttgctaatc caaccttata cattccagct cacagtggag cgtgtctaat  59940

tgccacagca gcatttatgt ggaacgtggt tgcacaaaag ctccagaaag tcaggctgag  60000

ggctcctatc tctcctcaat cttggtttac gatgtctgtt tctgaggaat cctgggatgg  60060

ggccactggc tctttaagag agagcccgat ttggaaatct aggacttgat tgttgattat  60120

gggcaataga tacattttaa gaatgatgtt gtaggctgta tgaagtcatt tgatgattgt  60180

tttgttaatg gcttgcaggt cagattttca tctttttaaa ttaattatca tagaaggaga  60240

aaacaactgg atttcagaat tgtcccttga ggtgtactgg aaactaaggc gtgagggact  60300

cataggggtc tggcttggaa agtgtattgc tatgtccagt ttacacataa ggatgtgcaa  60360

atccagcagg ttagctgagc tgcccaggaa tatccaggca agaatgacca tattctgata  60420

attactcagg cctctgcctc atctccgctg cccccccgcc ccctgactct cttctgagtg  60480

ccagattcag cctccatttg aatgccaaat agacaggaaa ttagcatgcc cagaatccac  60540

gtctttagtg cactctctcc ccagctccaa acctgttact gcttgtgttc aacatctcag  60600

taaagctcaa caacatcgac ccattactta ggcctcaaac cttgggtggc atcgtcgatt  60660

gctcttttct ttcatacccc acattcaacc catcagccca tcccacaggc ccaagtgtgt  60720

cctctctacc ttcaaagcgt gtgtggcatc caccgcttat caccacctct gccattacca  60780

ctggagtcca gtgccatcat ctctcacttg gatgtggcca gagtgtcttt gctggtctcc  60840

ttcttgcttc ctacctttgt aacagcctat catctatctc tggtctccat agctcactcc  60900

catactttga gagggccttt gaaagcctta gacagatcat atcacagacc tctatactga  60960

aagtcgggat aaattttatc tctggaaaga gtcccaaagc agcgatgaac agatattttg  61020

tcctgtcact tgatgaagag gtggggcttt gagacccaag agcttagaat ggagagccta  61080

gatgccacta agcccaggca ctggccatgc ttcgagtgga gcttttgtgc tggtggagga  61140

gagatggctg ggggacacct gtaggctgag caagtccccg ttcatcagac cctggctcat  61200

ccagcagggc gtggctgatg ttttcaatgt tgtatcctga gtgggaccca gatgcttccc  61260

aactgtgcca catctgagcc ctgcatgcca tctgtccagt tgcagcctga ctgcaatgtg  61320

aggctgctga agagctctgg atggtgtgaa gcaatctgtt ttctagcccg agcctgcata  61380

gctggtggat cctggaccgt gattaagtgc atcacctagg cttcaatgag atggagtcac  61440

tgtgtgtcca aacagtggga taaaggcttt actctttgtc ttcctgctct gagggcacaa  61500

gctgcttgtt tctctcacaa ggacaccgtc tgtgttgctc aggtgctggg gtgaaaaaaa  61560

cagcaagcat ttgaaaaggc tgaagaagga aagaaagctg agagcggtac agccttgggg  61620

actgagccat cccattgtcc cagaggtggg ggtgttatca agacctgttt ttgagccata  61680

cctctgactc ttcctggaaa gttagaccca actcaagaac acactaagag aagtgtttcc  61740

ccctagccct ttcagattga aaggagacgc caaccttgat gggtggaggt agaaaataaa  61800

gtcccaaaac agtgtcttgt aagcgaaggg gaacatggct gggcagaggg cttctggtga  61860

aacttttggg agtattcagt tggaactcag gaaaaaaaaa ttgttttttt ggaaagaggt  61920

agcagccccc ttcagccaaa gctcataaat gaaggaatgt ctgagactca gaattacagt  61980

gaccaaggca agacattgtc aaaggctgaa taagtgagtt tgactgacag aggccatctc  62040

catttttagt atatggccaa gcatctttcc cacagtcttc cttgagcccc ttcccatccc  62100

acttctgaaa agcactgagt tggccattat tatgcttttt tcttaaatta tgaagttgtt  62160

ttcaggtatt gagaataaca cccaggtgct gaactcccag cataagaaat caaacattca  62220

aaatggagta aggttctgaa gctgacatct gtctctacac attttttttt ttctgataat  62280

ggcatttcct atctccaccc tcactctttt tgttgtggtg aactacactt cccttgttcc  62340

actcggttct gttgcacatg tgattaggca aggggcagat atgtgatatt tattatgagt  62400

cttttccacg cagagaggat ctaaatctgg ctctttgcaa ttgccttcat acatgtgcat  62460

acacaccaca cacacacaca cacacacaca cacacacaca cacacagaca catacatatg  62520

cacacacccc gactcaatgg aggaccctca tttgtagaag ggtaaaatgg gtgaggcgga  62580

aatgcctgta tggcaccatg gagttctgtg tagccagttc taatcctggg ctatttggta  62640

aggaatgaag ttggagatag tcttctgtcc cttacaacca aaggaattct aactaatagt  62700

ttgccaagtt ttatgtttat aataaaaaat gacatgcttt ttcttttgga tttttaatgc  62760

ttttgaatta aaaatgctag aacatgaact gattcttcta tcgctattta gatagagcct  62820

tgcaagagca gagcacgcat gctttcttta agaacaggtt ggtttgtggt cgtctgagga  62880

ctgttttaag gagacttatt atacacaatc atcccccaca aatgatttct aaagagaggc  62940

tggtatgaaa gaaggagttt ccatgattct gtcctgtggt tctggggaat tctgaaaatg  63000

aactttagat atttttgtga aattcttatt ttcatatttt tggtatctca gagttttctt  63060

ttctggcttc tgtttaacat actcttcttt gccctaaatc tctcttattt ttgctccttg  63120

ggacaactga agaatcctta gataattaat agtatgaaat actgcccttt tagttgaaaa  63180

atgtcacaat aatgtaataa gataaataag gaggtgtcgc tttaacctgt atcgtgtagt  63240

ctcctctact tactaacact tacttgtatt actagaagca ttatttttta aatcatggaa  63300

aattggtggc aagctgagca tacagttgtt tatttctgtt tgactgatta ttacaacttc  63360

attatttgat gaaggttctg tacgttttcc tttaagacac atagaaattg tgagaagatc  63420

ctgcagcccc gaaaggctac agtgttgatc caaggactct gagccgagtg cagggtttgt  63480

acttggacct gcaggctggg tggcgtctgt gggagcagtg tgttgagaga gattctgagg  63540

ctgtatgtgt cagggcctcc aggggaagga tgcattgatg gattaatttc tgccaaggct  63600

gaaagaggag agagtaagag gctgtagagg tgtcacagct gtcattgctg ttttaggcag  63660

tcaagctttt gggaaagtgt cagaaattga gccccctact ggatctatcg gagccctgtc  63720

aaatgtccat ttagatgtcc tggtgaacaa aagttctctg actcaccatt taaaaacttg  63780

ttccaaatga aattatggga gaaaggaaca tttttcatcc gaacccagaa tgaggatgta  63840

cccaaggaaa aggacgtagg ctcaggagct ggactgtggc tcagctggcc tgatgtatcc  63900

cactttgttc ctcccatggc tgggatgtct ctttgctctc catgacccat gtatcttgag  63960

gacatgacac atggaccaag cttgaactgc ggattcattt ttatgcattc tacctgtgaa  64020

tgattgcagc ggatctagtc gtatttctga gagttactca aactggactt cagcagtgaa  64080

ctctacagtt ctcttttcct cccacctttc tattagacat tgcatgatac aaaaatcaag  64140

atatttctaa gagggtgata acttcaatgt tatctaaact tttaatttgg aagaagaggg  64200

gttctttgtt ctttttaaaa agatacaaac gaacttcttt atctgattct ttttttggtg  64260

caaacccatg atgccttctt cctgattcat ctgctacact gtgagttcaa gcctggcgtg  64320

ggacacaggc acagctctca tgccaacgat ctcatggtta agttttggaa cataatttga  64380

aaaatgtaac ccattgagag gcagtaagga catacggtga gctagtgcgt gtttggacgt  64440

ctgtgtggaa taagtgagtg ggtagagagg acatttgtca aggagcggga gggcgggcca  64500

ttggcttggg ggaaatgggc tgagactcta ggggtggcca gcaccgcata cggaggccag  64560

cagggttggg cttggctaag tgctgtggtg tctggatgcc tatgtgagtt tcctccagaa  64620

gttttcagtt ggcaaagtag aacctgctgg atatgtagca agggtgtgga ttgtcgggat  64680

cctgctgggc gcaggcgtgt gataccagag gtcagaacag aagctgaggg atgaggcttt  64740

gggagctttt tgtcatgcac tgtcctggag cctcagttac tacaaagtct gcaaatgata  64800

gaccggagct ttggttctgc ctgatgctag ctcccctgtt cctgattttt cttttcaata  64860

ttagacttaa tcccagaatt cacatgttga aagaaaactt agaggtctag tgacataaaa  64920

gcctcatttt gatcgttaca gaactgatgc cttgagaaat ggagagagaa gtacacgatc  64980

atggtaatac tggatgttca ctgagcactc actagctcca ggccttttct aagtaattta  65040

tgaagttgtc aggtttaatc ctcacaacgc ccttatgaat gagctattgt tattatcccg  65100

atttggcaga tgaggaaact gaggcttgag gggaggatga cgtactcaag gtcacacagc  65160

tgggaggcgg caagctggaa gttgaaccca aggagtctca catcggagcc aggactctca  65220

cccttcagtg ttatgctgcc ttaatcaggc acacatacag gcggggagag gcaggtttcc  65280

ggacaccaga ctaggctggt gccggtcagg ctacaccagg gaacctggag gcctgtcatt  65340

cttttgtgat gctgttagtt cctgttgagg aagtgaggct ttgtgggttc ccaggaggaa  65400

aaggtatgaa ctcatggcaa aagaaaggaa ccaaaaaagg gagatttgca tcacaatgag  65460

ccttctattc atcctaaatt atacctcctt ttataccatg tgtgtctgca aacttgtggg  65520

taaatcacaa atctttctgg taagttacaa tggatggaag gtttttgcat ttctctcaaa  65580

tcaccaacca tttaatgcta tgtgtagtca ctccctaatc tatcttttgt ataaatttgg  65640

atctttgagt attggggttt tccatgatgt ttggcagttc cccttagggt gtctatctca  65700

aagtttgtca cactgacaag ctttggggag agaagttaga ggtgggcttc cctgttttta  65760

gtggctgtgt ctgattgttc tgtctgttct ccaggacagg agagattgat tgctttctag  65820

ctttttttaa aattaaaaca acaacaacaa aaaaatacag aaaggtacaa aggataacaa  65880

acacattcat gtacctgcca cctaaaataa caattactaa tcttttcacc ctcctagccc  65940

atgatcttcc ctcccaggct gttattaata tgaaaaccga gttcaggttt ttatactttt  66000

cgacatctat ttatattaac gtatgtatta taaataatct tagtagtttt taactttgac  66060

ataagtggct tcacattcca cataacattc tgcagcatgt tttcttttat ttttattttt  66120

ttctttattt ttaaattttt attttgcagc atgcttttct tattcaacat tacatttgaa  66180

ttttttcaac attgtacatt gaaatttagc tcattctttt taactgctct gtagtattta  66240

ttgtatgcat atactacagc tttctatttc tgtattgatg gttaattagg ttgcttacag  66300

ttttttaaga ttacagattc tgctgtaata accatccttt gggcaagtgt atgtaggtac  66360

ctatatatga gtttctctag gattcatacc aaagtagagg aattggtagg gcattggttt  66420

gctggtttta attttaattc acatgctatt gtcaagctct ccagaacaac tggatgagtt  66480

gattggatca atgagtattt ccatcaccag catataaact ctttcctcat aatcacacca  66540

atgcttgatc ctgttggact taaaattttt gccaatttgc tgggtatgca acggcatctt  66600

acctaatttg cctttatttg atgactcctg aggttgaaca tctggtcata tgtttatttt  66660

ctcctctgtg gcttgcctgg tttaatgcct tcttcatttt aaagaatcag atagttttct  66720

gttattgatt tataggaact ctttatataa gttgaaaact tgattatatg tgttggaaat  66780

actttttcta ggctgtgatg ttttaaaata ttgctttaga tgggttttca tttttacctt  66840

ttattttaga gatggagtct cactgcattg cccaggctgg attgcagtgg ctattcacag  66900

gaaagagcat agtatgttac agcctccacc tcctggtacc aagaggtcct cctgccccag  66960

cctcctgaat aggtgggacc acaggtgcac atcactgtgc ctagctttgg atgggttttg  67020

aaagaaagaa gttttaaatt ttaatgccct caaattcatc tgtattttcc tctgtgcttt  67080

tattttgtac ccactctaag tagctccgaa ttctgcagat agttggtgca ggaattctga  67140

ttttgagtgg acatctgctc tctaacagtc acattgaagg aaattaggtt tttttggtag  67200

gaatctaagc aaggggttga tttgtaaact aggctttaaa tatgatttta agcaactcac  67260

ttagaacaag atacaaaaat tgtggactgg acctatatct ggaaaacttg aaagtgctag  67320

ggcaataaat aattcttggt cacatacagc cgagatcctg ggctcctgac tctgggacag  67380

aagctttcta tattttatct catcagtctt tgcaacaggc tccttgaagc aattttatcc  67440

ccattttaga gataagaaaa ccagagctta aagcagttag ataatttatg aagtaagtgg  67500

cagagccaag attcaaatcc agacctttct gaccacaaag ctcgttgctg aataccgcgc  67560

ctcattgcct tcttgcgaat tacttgggat ttgtttgaat cccaaaatct ttatatgtta  67620

ttttaaattt gaatctaatt ggaagtgggg cagtgagggt agaggacaga aagaagggga  67680

agagcttgag actcaataat agaaacaaaa aacccgtctc caggagggcg gttcaaaagg  67740

aagaattcca tatttcatgt aactgaaacg ttaaaagccc aaataattgc atcatgcaag  67800

tctgatgctg agtaatcacc ctcccccata ttattgggga gagggggcaa gaagtctggg  67860

aagctgtttt tgcctaagga attacattcc aggggactct gaggatttag gtaaccacaa  67920

aagccattta tttcgagtac actgagattt ctaccacttt gatccctaat ccatagcata  67980

attaataaat gaaatgtgct gtagcatggg ttttttacaa agtgtacttt taaaatggct  68040

tttggtctga catgattcat ttgccacttg gaaaagcgtc atcgcctcag atgggcaggc  68100

tgggagaggc tgcctggtgg gtagctgagg gcggtttcct ggggcacagt tcctgccttg  68160

ggcctctaca gagcggtctc atccaaacat ctcccagact ctgcgttttc caggaagcgt  68220

gcagaaatag gaggccagta ctgaaatgct atctgctctg tgtatgtcag aagaccacaa  68280

accacttata acaaatgaag atctttttat ttgttcttat ccctttatgt cacttgagga  68340

aagttgctgt gagtaggtga tgatcattac agtgatcact ggttgcccaa actgagaagc  68400

cagacatttg gcttggtttc tctcccttcc tcttgtctct cctaccctgt aaacacatac  68460

ttggtgatta cccatgggga gacaagacag gctgggaata tatacttctg caacttcagc  68520

ctcctgggtt ccagcgattc tcctgcctca gtctccagaa gagctcggat tacaggtgtg  68580

caccaccagg cccagctaac tttttgtatt tttagtaaag atggggtttc atcatgttgg  68640

ccaggctggt ctcgaactcc tgacctcagg tgatctgccc ttctcggcct cccgaagtgg  68700

tgggattata ggcgtgagtc accgagcctg gccccaggca ataatatacc agtgggcaag  68760

aaaatattct tgctctcatg ggacttctgt tgggggtcag ggtataggga ggaaggcata  68820

gagatgaaaa ccagtaaata agtaacaggg gaaaacattt taaatacatt aataactaat  68880

aaaatagaaa taaatctgtt ggctacttaa caggatgtgc cacattccag atacattacg  68940

ttaatcctta tgatctttgg gggctaagta ttagtattcc attttacgga tgaagagact  69000

gaggctcaga gggaagggag gtggcttttc tcaggtggaa agccagacct tttcagtggt  69060

cattcagttc atagctaagg tcttattttc tgtgctctct gtcggctgaa aatgggcaag  69120

gtaatttcac atagtgacag gagccatgtc agagaaagag caggacagtg ggacagagag  69180

ggaccaggct gggggctgtt tgagatggag ggtcaggaag aaccaaacta agatgtgaac  69240

agtgggaggt gttggagctg tggtgcttgc ctagaaggac cctcatcgag caaatagaag  69300

cttctggcag gaagaagtta atgtcttgcg tgtgccctat gtaggttcat tagggccttt  69360

aaagggggaa gaaggtggtg gctataaatg ttacaatctt acctttggcc cctagggatt  69420

ctgtctttca accttggttc agtaacaact tgtgactgcc caacagggct tcctttcggg  69480

agagaatggc ttgttacatt caaatatgcc atgaaagtat caccatttat ttcagtgtct  69540

gatgccccag cttgggcagc ctgagcaggc tctgaatggg tctgaagagg ccctttagag  69600

tagagatgaa gagggggtgg ggaatcctca attctaaaca aagagtctgc aatgggaaga  69660

tggccaaatg ctgtttttgg agtgggtgag agggaaaaga aaggtataga tggttcgttg  69720

gaaaatgtgg ttttataccg ggttttggtg tcaggtcccc gagggcaaca tggactccac  69780

actgtgatcc tccgggcagc tcatagcccc agccccttcc ttttgcttcc tggtcagttt  69840

gtgagaagga ggggttgtgt ctccaatctg agcaataagg ggtctgaggg gggttggatc  69900

catgtggctt tcctgtgtct tgttccttgt aaaagttcca ggttttgggt cgtgagctgt  69960

gtgtgtgtgt gtgcgtgtgt gtgcgctgta cgttaatatg gagagatggg cttgggccag  70020

tgggaaatag agagacccgc aagcacagag tgacagggtt tgatagtaag cagcaggcca  70080

gcgttgctgc ttttattcct cggtaaatcc ttgcacaatg ccatatgctc ttgcattccg  70140

tagctgctgc atagggtgtg atttagttaa tgcccgctct gcaaacagga aacggtgctc  70200

actgctgtgt atgcttttca tggagataaa gtgtcaggag caagacccca aacctgcgaa  70260

atcactaatg caaccgcccc ccatgcccca aaaggtggga gtgggggata aaaagagtag  70320

gaaagtggtg tggggagggg aagctttagg gccataactc agacaatttg tcaggcagtg  70380

gcatcggttg ggaggaaaat attgatgtac actttttgtt tttgaacctg aagtttgggt  70440

tttttcggat gcattggagg acttttaaat gttttcggag tgccagagtt tggactgtta  70500

ggtcaccgta ggtaccggct tgcatatcat ttcagaggaa tattttcaaa actccataaa  70560

aacatgcggc tttcaaggct ggaccacttg ttcaggtcct cctcccaccc cccacccttt  70620

ttggcaaaac catgcaaaca ttggtattca aaaatatttt gttacttttc ttggcaaagt  70680

gttccaagaa ggaattgcaa cacagtctca gagttaggag gcaactttct ggggaaaagg  70740

cgggggttgg ggaggtttgg agtttgaatc aaaaacagac accgaagctt taataaaata  70800

aatgaagcgg agccctttca gctcacggtg gactgtgttg gtgcgcgggt caggctttaa  70860

cgtgcctagt ggaaattgac agtctgagaa ctgggacata aacaaaaatg tcagtccctg  70920

ggagtcttgt tcactggaca atgtctcaat tgttcctttg gttttcaagg cagcagggag  70980

agtggaatat taactgttta ctgcccaaag ctggctcgga aattgcttgg agaaggggag  71040

aaaaaagaca gaaaatcaca ttttttattt agaaactatt aaacatgtca gtaagagata  71100

ggaaaagagc agattgtttt ctccttaatt atctgccatt cacttccata tttctgcata  71160

ccatttttgg ggtgtgtgtg tgtgaaggaa cagcagggtg tttcttttta aatttgaatg  71220

ttagccttgc atattgtcag tttttaaagc ttgctggcat gtagattatc cgcccccggt  71280

ggatatgaca gtgggcttta ggaaaggaag tgtgatttct gataacattt acatcttagc  71340

tgttcagcgg ataccctgtt agtgtttgtt cttcagaatg ctcagataga acaaaaatca  71400

agtggttgga attttaaaaa acaaaatgta tttggctctc cataaaaatg catttagtga  71460

taaagggggg cagcaagtaa ctatgtctga gagaaggaat tgcaggcaca gaggagatcc  71520

agaattctgt tcacacttga atttacttga ttcgagaaac aaacagcaaa gcctggtgta  71580

ttggccttta tctgggcaaa gttcaaaact caactggtaa ttatgtcctt agaagcctta  71640

aaaggactgt gttgttacaa aagcagtgac tgagcttact tcttcaggac cgaatgcact  71700

cgagttgttt gttagataaa cttgttttaa taaatggggg ggtcagggga gaggtttctg  71760

ttcttggaag attccctgat aagtagcttt cttctcttgg agaacttcag gctttctctc  71820

caagcgaggg gtttgcaggc agctaaagtc agcttcggct tctgcttcct gtcagtcagg  71880

aagtcacttc cttaacccaa attacaagct agagcacaac tccccagcca taccgaaaag  71940

agcaggtttt tcccagaaga ctgtgtttct agatgcggaa gtgtaaattg gtacgctgtg  72000

tgatcatgga atgcccaaaa tacataggga acagtgttgt tggaaagagg cgctgtgtcc  72060

ccaaggagaa gacgccgccc agaatggctg gatcgcctgt tgtggctgag tgcgaggcag  72120

ctgtggctgg ctgctgtgtg acgatgacct agtagccacc catgtggagt cctggctgcc  72180

tcagaaccct atcacatcta ggcaaaatct tgcatttttt atctgggagg cctgaggact  72240

tcagggctgg tggatagtaa gctccttggt tatctcacag atacaagagg tcttgggaat  72300

ccacgatcaa acttgatgtg tgcgtttacc ctcctccctt tgaatctgtt attcaaatat  72360

ttaagcctcc aaccttgtgg cccctacctg caccacccct cacccccccg acaaaaatca  72420

agctcttgac ctcatggctt ctttcagtga cccttggggg acagggtttc ccaaggctgg  72480

ttgccagctg gcatggtccc ccgttggtga agtggagacc tgtgtttttt tggtcatttt  72540

gcaaagagct tatggatgac agcagttctc tgtgcctcgc tgggacagag tgtattctga  72600

ggtccagcgt ctgcatggag atctgcctat ccttcacttg gggtgctcag tagataacgc  72660

ggccactttc ctatacattt ccttaattta agggaacagc gtaaactcag cccaggtgga  72720

ttaatctctc cagtgacttt tgaaacttca atttccaatt tccctcttat gtctaggtgt  72780

gagtgaggat acgtgtagta attgtcgcag gtattagtga gaaagggtgc agatcacaca  72840

aatatttcac acgttattag ttggaccaga ctttggaggc aagggagggc cgtgtcacct  72900

aggaaatttg ctcttccgtg gagatgaaag ggcagtgaat taagtgcctg ctttttctcc  72960

ctttttccct ctgacggtta ttgatcctcc cctggaactg tacagttcac gttctgatct  73020

ttttcttgac aaagggaatt cccagtttgt tcgctggcga acgcactagc aggtgaggag  73080

ttaaaagttg gcaacgcctg ccctctcgag agtgtcagga tttttagtct cttccttgag  73140

agctagaaga tgtttctaaa agaatctctt tggtgactta gaagtggaga gagctttaga  73200

agcatggcac aaataaaagg aaagaggcaa acaccgtcat tctacatctg tttattttgt  73260

tattaacaaa aggcaaggcg attttcatta aagttttgct ggggttgggg ttgagggtgt  73320

agagagcaaa agtgtgagtt gtacaccatg actggaatcg cttggacata ctcttcagca  73380

gacatcgtgt gactgtggaa gaaatgagtt tcatgaagat gactgataga aggaagccac  73440

tgaaccagtc ctctatcacc tcttccaagg ctaaagtttg gagccacttg cagaaggctc  73500

tcctcaaacc cctgtgttct ttgcctaccc ctgctgttgc cacatcatct tggagagctg  73560

gctgcttccc tcctcaacta gaagttccta gtgcctgctt agttcttgtc tcttgcttcc  73620

caagtgctca caaaatacat ccatgttcgc tacgaggaaa tggaccacat aaggtttccg  73680

tgaaaacctt agcccttagg tctaacacag taggaacaga agttaatgtt ttcctgacgt  73740

agaagtttct cttgctgctt ctggtcacat ttctttcttg tgtggttctt ctatggctac  73800

tgcacttttt tttttttctt actgtctccc ccttccccca cacaccacct tttggggata  73860

gggtggcagg tgagaatata aacagataat ggttaagaga tagtttagtc tttctaggcc  73920

agattattta gtttttgcca tctaggtaaa attcggtcca attaagcgtc cattaagtgt  73980

tttaatataa gctggagaag gagttgaacc tggaggtcag ggctctgtgg tctattacag  74040

tccccctggg gtctctagcc caagggagac tccagggtct taataaatga ctgggggttt  74100

cattttgagg cctttactac caaagactga ataatacatt gggcatgatg gttttgtcct  74160

aaacattaac agccacaaaa ggtagagagt gtgtctgttt atagatacac atgtatcatg  74220

aataattagt tggggactgt gcatcaggtc tctcatttta cattcgagga agcaatgcac  74280

ggaatgaatt ctggacctgc gaactctgaa tttcaattct ctgtctccta cttttactgg  74340

agtgcttgca aacagtacag tgtttttgtt gtgaagttat accgtgcctg taatctctct  74400

gcgggtggcc ctcctaagcc ctacttcaag aaatagctct aagctcatga cacccgcccc  74460

acccgatgcc tacatatgtc ttatatcctt ggagtagtgt ttggggttgc aaatttgact  74520

ttagggagac atactctctg atgataggct aatgcttata tttactgata aacttccttt  74580

ttgacggtca tgggcttcgg gggccaccca accaaactgt gtggctgctt ttatgttggg  74640

ccaaaagaca ggctccttgt gtcctcccag tttcttaaac aatgaagtca tggcatttta  74700

cagtgctggt gaatggattg agattgtggt ggccctggaa tgtggcactg ctctggctgg  74760

agggaagatg agagtgaggg atggagagga gaggagagcg ggagatggga acctggtgga  74820

cacaggaggg agtgtgagtt ctgagggcca aaggaaactt gacaccggat gggacattaa  74880

tctgattctg ttatctgagg ctgtcaccag tcctccctgt cctcctggca             74930

<210>2

<211>384

<212>DNA

<213>Homo sapiens

<400>2

ttcaggccat tggtgttgta tatatttcaa gatttgctca caggtccaaa gcttaactta     60

agctccctga gacatatcat aaaatatgat ttggggaaaa accctaatgg gccatgatca    120

gaacattatt attcaacaaa ggatgaaatg cttaagccaa gatggccttc tttctttctt    180

tctttctttc ttttttttta atgaaagttg agcagactcc cgtccaacag ttttcaatgt    240

aggaattccc acagccccat ttgattgcag tttgttgaaa agtttaatgt ttttgtaggc    300

aattcataat ttccacattg aacagcctga gaggaagaga gctggagccc actgttgttt    360

ttgtagtggg atggtgggaa cttt                                           384

<210>3

<211>20

<212>DNA

<213>Homo sapiens

<400>3

ttcaggccat tggtgttgta                                                 20

<210>4

<211>20

<212>DNA

<213>Homo sapiens

<400>4

aaagttccca ccatcccact                                                 20

<210>5

<211>366

<212>DNA

<213>Homo sapiens

<400>5

ttgtcccttg aggtgtactg gaaactaagg cgtgagggac tcataggggt ctggcttgga     60

aagtgtattg ctatgtccag tttacacata aggatgtgca aatccagcag gttagctgag    120

ctgcccagga atatccaggc aagaatkacc atattctgat aattactcag gcctctgcct    180

catctccgct gcccccccgc cccctgactc tcttctgagt gccagattca gcctccattt    240

gaatgccaaa tagacaggaa attagcatgc ccagaatcca cgtctttagt gcactctctc    300

cccagctcca aacctgttac tgcttgtgtt caacatctca gtaaagctca acaacatcga    360

cccatt                                                               366

<210>6

<211>21

<212>DNA

<213>Homo sapiens

<400>6

ttgtcccttg aggtgtactg g                                               21

<210>7

<211>20

<212>DNA

<213>Homo sapiens

<400>7

aatgggtcga tgttgttgag                                                 20

<210>8

<211>558

<212>DNA

<213>Homo sapiens

<400>8

gctgtgaaat cccctgtgta gtgggaagaa gaaatagcaa atcttagctg ccttggacct     60

gatataatta tttgtcttca tttacatggt tyatccttca aggttgaata aatgatgtgg    120

gagctagtca aggggcttta ggtatgtgat ttcatgccta ctttttttta ggtagagaaa    180

ctgaggtcac agggtactag agaatggact ctaagattca ggtttctgaa ttgcctgtgg    240

ttttgttgac tcaactgctc ttctgttgtt ttttagccac atgccttgaa acagtcctct    300

ttcccatgtt tcttcatcag caccattaac ccaaggtata ctgtcctctc ttatctttca    360

caaggtcttg gagttcccat gcctttgtaa gcatccctcc ccgagattca gcaccaacca    420

aaatcacatt tggaaaaatt gcttgtttcc caagaagctt tggaggatat gattttgtat    480

agaacgggtt cacaggtttt ctgttcattc ttctatggtg gagtgtgtgt gtatgtgact    540

ctgtcttctc tccattcc                                                  558

<210>9

<211>21

<212>DNA

<213>Homo sapiens

<400>9

gctgtgaaat cccctgtgta g                                               21

<210>10

<211>23

<212>DNA

<213>Homo sapiens

<400>10

ggaatggaga gaagacagag tca                                             23

<210>11

<211>364

<212>DNA

<213>Homo sapiens

<400>11

aagggagaaa gcaggattga gcagggggag ccgtcagatg gtaatgcaga tgtgatgaga     60

tctctgccgg accaaagaga agattccttt ttaaatggtg acaaattcat gggctttctc    120

tgcctcaaaa cctagcacag ctgttattta ctgaacaatt agagagctaa gcacttttta    180

gataytatat aatttaattg ccgtatgagg cacccttagt tttcagacga gaaaccacag    240

ttacagggaa ggcaagtaac ttagtcaatg tcagataact aggaaaaggt tagaggggcc    300

ctggacacag gcctgtgtga ctgagaagct tgggcacttc actgctacat ttcatctctt    360

cgct                                                                 364

<210>12

<211>20

<212>DNA

<213>Homo sapiens

<400>12

aagggagaaa gcaggattga                                                 20

<210>13

<211>22

<212>DNA

<213>Homo sapiens

<400>13

 agcgaagaga tgaaatgtag ca                                             22

<210>14

<211>579

<212>DNA

<213>Homo sapiens

<400>14

ctgatgaggg tagggagcat ctgtctgcag cttcatcttc attgtctagg ggctccagaa     60

atatctgtga gtaaataagt tatttaatct ttgcctcaaa tttccagtga ctgtagggat    120

atagctgtga gcctctagga gctgagattt tttaaatttc ccacttaaac atttatttaa    180

aaattttgtg ctcagcatgg actaaggact ttacattcat taactcattt acagcttgat    240

cctatgcggt gggcattcat ttacagagga tcccatttta caggtgagga agaggccagc    300

taggggtgca gcctaggtta gtattctaga gctcatcagg ctgtgttgtc cccagtgaaa    360

gaataagcaa agaagtgaat gttgtgcatt gagaaaaatg actctcggag gaggatgagc    420

ctctcggata tggcgaccga agtgatwtgg ggcccttgtc aagggtctct attatggcat    480

caagaaaaga tgctgctttc ggtgatgccc gaggagagcc tcaatatttt acatgggaaa    540

cctaaaaaag gggccatgtt gtggtctctg cacctaaga                           579

<210>15

<211>19

<212>DNA

<213>Homo sapiens

<400>15

ctgatgaggg tagggagca                                                  19

<210>16

<211>22

<212>DNA

<213>Homo sapiens

<400>16

tcttaggtgc agagaccaca ac                                              22

<210>17

<211>486

<212>DNA

<213>Homo sapiens

<400>17

tatttagaaa ccataaaatc cacctatttg aggtgtacaa ttgagtgatt ttctgtatag     60

tcacagatct gtgcagtcat ccacaccctc taactccagg acattttcct cacccccgag    120

gagaaacctc ccttacccat tagcagtcac tcctcatttc ctctcccccc agcccctggc    180

aatcactgtg gatttgcctg ttcttgacat ttcatataaa tggtatcata aaatctaygg    240

gcttttgtgt ctgtctgctt tcacttagca tacggttctc aaggttcatc cagtattgta    300

gcatctatca gtatgtcatt cctttttatg gccaaataat attttattgt atggatagac    360

attttgttta ttcatttatc tgtttttggt tattatgagt aacactacta tgaacatttt    420

gcacaaattt ttgtattgac atgttttcat ttctcctggg tatagtccta tgagtggaat    480

tgctgg                                                               486

<210>18

<211>27

<212>DNA

<213>Homo sapiens

<400>18

tatttagaaa ccataaaatc cacctat                                         27

<210>19

<211>22

<212>DNA

<213>Homo sapiens

<400>19

ccagcaattc cactcatagg ac                                              22

<210>20

<211>428

<212>DNA

<213>Homo sapiens

<400>20

ttgtctcctt ttgtttctgc tactgtgaat gatcctgtga tgatcatctt tgtgtgtaaa     60

tctttgtccc ctcgccccct ccccttttat tattttcttg ggatagaccc caggacaaaa    120

ggtagaaaag aacaaagtgt taaaaaattt cttgatacat agccacagat tattttcctg    180

aaagttctca acatttataa ctacsagcag tatgtaagag agttatggtt ggaatgattt    240

taatgtctct ggggaattta acaacaaaaa aactttaggc ttctttggag agagacatgc    300

ccttaactcc accccgccct agaacagaga cccagcccat ccaagtcagc ctccccaggt    360

cctccacctt caaaacaggc aaacgaaatc atttcttgaa taattggtag gcttcaaggt    420

cagatgtt                                                             428

<210>21

<211>23

<212>DNA

<213>Homo sapiens

<400>21

ttgtctcctt ttgtttctgc tac                                             23

<210>22

<211>22

<212>DNA

<213>Homo sapiens

<400>22

aacatctgac cttgaagcct ac                                              22

<210>23

<211>330

<212>DNA

<213>Homo sapiens

<400>23

tcagggacag tgcataggtg taaagaagtt gctggttggg ggttctaatg caggtttctc     60

caaaagtgaa tgccctgtta aaaaaaaatt cttaacaaat atacagagat ttttttttta    120

aaaaagtgtg acagttctag acacctagag agtaaartga agaagcctgt tttcaggttt    180

cccgcctccc tgaatttccc agcatggtcc aggctttgaa atttatttat ctgcttttgg    240

caatggttga tgggaatttc ccacatttat tttttagcta cagagaaagg acattatctt    300

taaaatctct tcgttgttct ctctctttga                                     330

<210>24

<211>20

<212>DNA

<213>Homo sapiens

<400>24

tcagggacag tgcataggtg                                                 20

<210>25

<211>23

<212>DNA

<213>Homo sapiens

<400>25

tcaaagagag agaacaacga aga                                             23

<210>26

<211>574

<212>DNA

<213>Homo sapiens

<400>26

tatttagaaa ccataaaatc cacctatttg aggtgtacaa ttgagtgatt ttctgtatag     60

tcacagatct gtgcagtcat ccacaccctc taactccagg acattttcct cacccccgag    120

gagaaacctc ccttacccat tagcagtcac tcctcatttc ctctcccccc agcccctggc    180

aatcactgtg gatttgcctg ttcttgacat ttcatataaa yggtatcata aaatctatgg    240

gcttttgtgt ctgtctgctt tcacttagca tacggttctc aaggttcatc cagtattgta    300

gcatctatca gtatgtcatt cctttttatg gccaaataat attttattgt atggatagac    360

attttgttta ttcatttatc tgtttttggt tattatgagt aacactacta tgaacatttt    420

gcacaaattt ttgtattgac atgttttcat ttctcctggg tatagtccta tgagtggaat    480

tgctgggtca tataataaat aactgtttaa cattttgggg agctgccaaa cttttaaaac    540

cttgggttct gtgatgtacc agttgtgtta ggca                                574

<210>27

<211>27

<212>DNA

<213>Homo sapiens

<400>27

tatttagaaa ccataaaatc cacctat                                         27

<210>28

<211>22

<212>DNA

<213>Homo sapiens

<400>28

tgcctaacac aactggtaca tc                                              22

<210>29

<211>571

<212>DNA

<213>Homo sapiens

<400>29

tgccaggggt tttatggtta attttcctcc attatgaggg ttgactcagc cttgggtatt     60

agatgtcttt gagaatccag ggttcaaata ccacagctgg tagaatgttt ctcaacttgg    120

agccaatctc catctactga aggtacgctg gtttagacag acaacaggga catcagcatt    180

ttaaaaagcg gtggaaaaag tttgcttgtc ttgattggag ccatgacatt ttattttgaa    240

atttcaaata acatgaaggg aggtttggag cggtttttgg tttatccaaa gggcagtgga    300

ttgaaggctg agaaacacca ggctgaatgg gagaggggtt ggggtccccc tgtgagatag    360

tgaaacaatg gtagtgccat ccaatgatag gcacttttct gtcattcaga agcagaaagg    420

gggccagagg cccattggcc ttactgggma gtaagctgta gagctgctgc cttttcgtga    480

aagggttgac accaaccttc tcccccagga agagtgacca gggacctgag gggcatggtc    540

gagcagatga cagcctttgt aaaacatctc c                                   571

<210>30

<211>20

<212>DNA

<213>Homo sapiens

<400>30

tgccaggggt tttatggtta                                                 20

<210>31

<211>23

<212>DNA

<213>Homo sapiens

<400>31

ggagatgttt tacaaaggct gtc                                             23

<210>32

<211>614

<212>DNA

<213>Homo sapiens

<400>32

ttggtagaga tggggtctcc taggctggtc ttgaactcct ggrctcaagc aatcttcctg     60

cctcagcctt ccaaagtact gggattactg gcgtgggcca ccatgcctgg cttgaaattt    120

ttctatggct ttattctttc tccaagtaca gagtctaccc aaccttctga gatctttggt    180

tttcttttcc taggtaacta tagtacatac ttatttatgt taaacaacag caatcacaca    240

tttctttttc tatacagtca tgctttatag gcaaataaag cctccgtctt aggctttctg    300

gattttttca aaagatgcaa ttcctggagt atgtttttac ttagagcaaa gcagcctagt    360

ctcctatacc ttctgcatct gcagaaaagt tggttaaaca gactttgtaa tgatgcccct    420

tacaattctg aagggacttg tgaaatagtt tcacagagtt tcagtgttag gtatatttga    480

tcaatgctaa cttttggaaa actttggtgc ctgtatgatt cagagggtag ggcagaatat    540

taaattaatc acaacttctt gtattttaac cattctgggt aaattgggat tccgtgacgc    600

ccaggcaaaa ttat                                                      614

<210>33

<211>20

<212>DNA

<213>Homo sapiens

<400>33

ttggtagaga tggggtctcc                                                 20

<210>34

<211>20

<212>DNA

<213>Homo sapiens

<400>34

ataattttgc ctgggcgtca                                                 20

<210>35

<211>633

<212>DNA

<213>Homo sapiens

<400>35

tatcttatat cccctccaag cattcattaa ctgatggatt agtgagttgg ccttgagaag     60

cataaaggct cgtctccatg tgcttctaag cattgtgtct aagttctgtt tggtttcctg    120

agtgaaactg tcttaatgtt accaacagaa gttaaatgcc taagagwttc ttatacatgg    180

gctgagtacc tctgtgactg ggcaagccac ctcacctcat tttaccttgt ctgcaaaatg    240

aggaactggg tcaactcatc gttcaaatct cactgaaagc taattgatcg cttttgacag    300

aagtagctcc cttgggccgt atatttattt cctagcttgg aggaaggtgg ggacagacag    360

aattgatgta cacctttatt tttatctcta tggtaaacct gtgcatacta aagcattcct    420

ctggtctttt gagatgagtg tatacattgt gtctggccct gtgcattttt taccaagaag    480

taagttttgt tgagtaaact tgggttgtat gaagaactgc atgctcaccg tactcaagta    540

gcttttgcta cctaaaggac agctgctcat atgtacttga cttcctttaa agtgaaggat    600

gatgacattt gaaaaacgga ggttgaaaag gag                                 633

<210>36

<211>25

<212>DNA

<213>Homo sapiens

<400>36

tatcttatat cccctccaag cattc                                           25

<210>37

<211>21

<212>DNA

<213>Homo sapiens

<400>37

ctccttttca acctccgttt t                                               21

<210>38

<211>1081

<212>DNA

<213>Homo sapiens

<400>38

ttgagcatgt gttatttaat gagttatacc tctgtcatat gtgtgtgttt atatcacaaa     60

ataacttatt tttataaaac catattttga gtcatcattt gtgacaatgt cttcttttct    120

ctggtataaa tgaggcatgt agaaagaaga ttgacatttg ctagaagctt cccctttcct    180

ctaactccac aataaaatgg atgctcataa ttacatctgc tcctataagg tcaagatttc    240

agggctggaa gtgaccttag atcatttagg cccaacttgc cctcaggaaa ggaaactgag    300

gcccagagat gccttaagtg aattgcccaa tgtcacacgc tgagtcagtg gccagagcaa    360

ggcttggatc cagttctctg ctccctttcc agagccttgt gatgtcttct ctcctacagg    420

aggtgaaaat aactgctgtg gctggttctg ttttgctgac tgtaaattgg gtcatggtca    480

gggacagtgc ataggtgtaa agaagttgct ggttgggggt tctaatgcag gtttctccaa    540

aagtgaatgc cctgttaaaa aaaaattctt aacaaatata cagagatttt tttttwaaaa    600

aagtgtgaca gttctagaca cctagagagt aaagtgaaga agcctgtttt caggtttccc    660

gcctccctga atttcccagc atggtccagg ctttgaaatt tatttatctg cttttggcaa    720

tggttgatgg gaatttccca catttatttt ttagctacag agaaaggaca ttatctttaa    780

aatctcttcg ttgttctctc tctttgagtg aggagagaag atgtgaatcc tggcagtggt    840

tcagagtgga cacagcccct gtgtttgtgg cataggctct gtgggcccca tgccagggag    900

cagtaccccc gtgtaaagga gtgggggttt gtccatttgg atagagcaaa gatcctccac    960

ctcaaatccc acaagaacag ttgccacaac ctgggcccta agcatctcat tttcctatgt   1020

agaaattaat gatctggagg agatggcaaa acattccttc cagagcctgt gtggattttg   1080

g                                                                   1081

<210>39

<211>26

<212>DNA

<213>Homo sapiens

<400>39

ttgagcatgt gttatttaat gagtta                                          26

<210>40

<211>20

<212>DNA

<213>Homo sapiens

<400>40

ccaaaatcca cacaggctct                                                 20

<210>41

<211>599

<212>DNA

<213>Homo sapiens

<400>41

tagtgctcag tatttccaac gttctgttta tttaagatga aaattgctgt agttaataag     60

cacttcccca tgtcattaaa atgcttaagg atttttaatg accacataac agtccataat    120

atgattaaac cccaatttac tgaatcaatg ccatattgtt gggtctttag attgtctcct    180

tttgtttctg ctactgtgaa tgatcctgtg atgatcatct ttgtgtgtaa atctttgtcc    240

cctcgccccc tcccctttta ttattttctt gggatagacc ccaggacaaa aggtagaaaa    300

gaacaaagtg ttaaamaatt tcttgataca tagccacaga ttattttcct gaaagttctc    360

aacatttata actacgagca gtatgtaaga gagttatggt tggaatgatt ttaatgtctc    420

tggggaattt aacaacaaaa aaactttagg cttctttgga gagagacatg cccttaactc    480

caccccgccc tagaacagag acccagccca tccaagtcag cctccccagg tcctccacct    540

tcaaaacagg caaacgaaat catttcttga ataattggta ggcttcaagg tcagatgtt     599

<210>42

<211>25

<212>DNA

<213>Homo sapiens

<400>42

tagtgctcag tatttccaac gttct                                           25

<210>43

<211>23

<212>DNA

<213>Homo sapiens

<400>43

aacatctgac cttgaagcct acc                                             23

<210>44

<211>599

<212>DNA

<213>Homo sapiens

<400>44

tagtgctcag tatttccaac gttctgttta tttaagatga aaattgctgt agttaataag     60

cacttcccca tgtcattaaa atgcttaagg atttttaatg accacataac agtccataat    120

atgattaaac cccaatttac tgaatcaatg ccatattgtt gggtctttag attgtctcct    180

tttgtttctg ctactgtgaa tgatcctgtg atgatcatct ttgtgtgtaa atctttgtcc    240

cctcgccccc tcccctttta ttattttctt gggatagacc ccaggacaaa aggtagaaaa    300

gaacaaagtg ttaaaaaatt tcttgataca tagccacaga ttattttcct gaaagttcts    360

aacatttata actacgagca gtatgtaaga gagttatggt tggaatgatt ttaatgtctc    420

tggggaattt aacaacaaaa aaactttagg cttctttgga gagagacatg cccttaactc    480

caccccgccc tagaacagag acccagccca tccaagtcag cctccccagg tcctccacct    540

tcaaaacagg caaacgaaat catttcttga ataattggta ggcttcaagg tcagatgtt     599

<210>45

<211>641

<212>DNA

<213>Homo sapiens

<400>45

tgctatgtcc agtttacaca taaggatgtg caaatccagc aggttagctg agctgcccag     60

gaatatccag gcaagaatga ccatattctg ataattactc aggcctctgc ctcatctccg    120

ctgscccccc gccccctgac tctcttctga gtgccagatt cagcctccat ttgaatgcca    180

aatagacagg aaattagcat gcccagaatc cacgtcttta gtgcactctc tccccagctc    240

caaacctgtt actgcttgtg ttcaacatct cagtaaagct caacaacatc gacccattac    300

ttaggcctca aaccttgggt ggcatcgtcg attgctcttt tctttcatac cccacattca    360

acccatcagc ccatcccaca ggcccaagtg tgtcctctct accttcaaag cgtgtgtggc    420

atccaccgct tatcaccacc tctgccatta ccactggagt ccagtgccat catctctcac    480

ttggatgtgg ccagagtgtc tttgctggtc tccttcttgc ttcctacctt tgtaacagcc    540

tatcatctat ctctggtctc catagctcac tcccatactt tgagagggcc tttgaaagcc    600

ttagacagat catatcacag acctctatac tgaaagtcgg g                        641

<210>46

<211>25

<212>DNA

<213>Homo sapiens

<400>46

tgctatgtcc agtttacaca taagg                                           25

<210>47

<211>24

<212>DNA

<213>Homo sapiens

<400>47

cccgactttc agtatagagg tctg                                            24

<210>48

<211>284

<212>DNA

<213>Homo sapiens

<400>48

ccatctgtgg agcagagtca ctgaaaggaa atactggaaa tactggaagc cacttggtgt     60

tttatcaagg atgtgaggtt tcctggcaac tttgtcgcca tatcatcatc atcatcacca    120

tcatcatcat catcatcatc atcatcatca tcatcatcat catcatctgc cctttaagtt    180

ttctgcttgt ttagaaaaga aatttataca gagcccccag tagcagctgt aagggggcag    240

gttcttggag cagcccatcc tcaacattct tgctgctgat ggaa                     284

<210>49

<211>20

<212>DNA

<213>Homo sapiens

<400>49

ccatctgtgg agcagagtca                                                 20

<210>50

<211>20

<212>DNA

<213>Homo sapiens

<400>50

ttccatcagc agcaagaatg                                                 20

<210>51

<211>145

<212>DNA

<213>Homo sapiens

<400>51

tccacgcaga gaggatctaa atctggctct ttgcaattgc cttcatacat gtgcatacac     60

accacacaca cacacacaca cacacacaca cacacacaca cagacacata catatgcaca    120

caccccgact caatggagga ccctc                                          145

<210>52

<211>21

<212>DNA

<213>Homo sapiens

<400>52

tccacgcaga gaggatctaa a                                               21

<210>53

<211>20

<212>DNA

<213>Homo sapiens

<400>53

gagggtcctc cattgagtcg                                                 20

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号