首页> 中国专利> 用于鉴定癌前结肠直肠息肉和结肠直肠癌的方法及试剂盒

用于鉴定癌前结肠直肠息肉和结肠直肠癌的方法及试剂盒

摘要

本发明涉及根据一些实施方案用于基于特定mRNA生物标志的一种或更多种表达谱鉴定患有癌前进展期(advanced)息肉或结肠直肠癌的受试者的方法及试剂盒。本发明还包括用于结肠直肠癌的诊断、预防、疗法管理、监测和倾向鉴定的方法及试剂盒。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-15

    未缴年费专利权终止 IPC(主分类):C12Q 1/6886 专利号:ZL2015800218752 申请日:20150402 授权公告日:20191126

    专利权的终止

  • 2019-11-26

    授权

    授权

  • 2017-04-05

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20150402

    实质审查的生效

  • 2017-02-22

    公开

    公开

说明书

发明领域

本发明涉及根据一些实施方案用于基于特定mRNA生物标志的一种或更多种表达谱鉴定患有癌前进展期(advanced)息肉或结肠直肠癌的受试者的方法及试剂盒。本发明还包括用于结肠直肠癌的诊断、预防、疗法管理、监测和倾向鉴定的方法及试剂盒。

发明背景

结肠直肠癌(CRC)是最常见的癌症之一,占所有癌症病例的约10%和所有癌症死亡的约8%。实体癌通常基于组织病理学组织评价来诊断,其中用于CRC的金标准为光纤结肠镜检查。这种技术是劳动密集型的、耗时的、昂贵的且极具侵入性的。已知,替代方案粪便潜血测试(fecal occult blood test;FOBT)尽管不是侵入性的,却受低灵敏度困扰。

筛查和监测测定对癌症的早期检测和管理至关重要。基于血液的测试能够大规模筛查临床上无症状(据推测为健康)的个体,以用于癌症的诊断、监测及预测。此外,基于血液的取样是普遍且方便的,并因此,可增加无症状群体中的依从性。

Bonilla等(Oncology Letters,2,719-714,2011)公开了与罹患进展期结肠直肠癌的患者中的不良预后相关的mRNA生物标志。

可与结肠直肠癌相关的数百个基因的综合列表被公开在例如Ye等,Plos one,2013;8(5),e62870;以及Garcia等,Clinical Chem.53(10):1860-1863,2007中。Marshall等(Int J Cancer 2010;126:1177-1186)公开了基于从外周血细胞提取的RNA的用于CRC的生物标志,其对应于以下七个基因的组:ANXA3、CLEC4D、LMNB1、PRRG4、TNFAIP6、VNN1和IL2RB。

US 2010/0330079公开了一种用于检测用于早期诊断和管理结肠直肠癌的蛋白生物标志的方法。该方法包括获得关于外周血中51个基因的表达的定量信息。

WO 2011/012136公开了一种用于基于一组miRNA的表达水平区分CRC样品与非癌性样品的方法。

对以改进的灵敏度和特异度用于早期检测和治疗癌前进展期息肉和结肠直肠癌的具成本效益、快速、准确和微创性(minimally invasive)的方法及试剂盒存在未满足的需求。

发明概述

本发明提供了用于鉴定受试者中的结肠癌和癌前息肉的方法及试剂盒。有利地,本发明的方法及试剂盒基于非侵入性的基于分子的分析(anon-invasive molecularbased analysis)区分具有癌前进展期息肉的结肠与结肠直肠癌。此外,本发明的方法及试剂盒提供了具有高灵敏度(至少60%)和高特异度(高于85%)的诊断平台。

本发明的前提是基于以下发现:早在明显的疾病(overt disease)外显之前,疾病相关的生物标志可在血浆或其他体液中被鉴定出。由本发明的生物标志所赋予的另一个优势来自以下事实:生物标志是细胞外的,从而起源于所有身体组织。此外,这些生物标志不受免疫应答影响。本文提供了来自罹患结肠直肠癌的患者的血浆足迹(footprint)的这些生物标志的存在或不存在作为早期诊断工具,对于其,治疗策略可被设计并施用以预防、延迟或逆转赘生性结肠直肠细胞的形成。本发明的数种疾病相关的生物标志的一种或组合对诊断罹患癌前进展期息肉或结肠直肠癌的受试者是有用的,或者有利地,对诊断对于结肠直肠癌为无症状的那些受试者是有用的。

出人意料地,如本文显示的,本发明的方法使用有限数目的核酸序列生物标志的表达谱来鉴定健康的受试者、患有结肠直肠癌的受试者及患有癌前进展期息肉的受试者。此外,本发明的生物标志在远离疾病部位的血浆样本中被鉴定出。出人意料地,基于所述血浆的生物标志提供差异表达的基因谱,该基因谱以高特异度和高灵敏度与病理检查报告相关。

根据一些实施方案,提供了一种用于鉴定患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者的方法,所述方法包括:

(a)提供来自受试者的生物样品;

(b)测量所述生物样品中包含SEQ ID NO:1中列出的核酸序列的生物标志的表达水平;以及

(c)鉴定所述生物标志的表达水平高于所述生物标志的截断值(cutoff value),从而将所述受试者鉴定为患有结肠直肠癌或癌前进展期结肠直肠息肉。

根据一些实施方案,所述生物标志包含SEQ ID NO:1且还包含选自SEQ ID NO:2、3、5-7、12和17的至少一种核酸序列。每种可能性是本发明的单独的实施方案。

根据一些实施方案,所述生物标志包含SEQ ID NO:1-3、5-7、12和17中列出的核酸序列且所述受试者被鉴定为患有结肠直肠癌。

根据一些实施方案,所述生物标志由SEQ ID NO:1-3、5-7、12和17中列出的核酸序列组成。

根据一些实施方案,所述生物标志还包含SEQ ID NO:1和5中列出的核酸序列,且所述受试者被鉴定为患有癌前进展期结肠直肠息肉。

根据一些实施方案,所述生物标志由SEQ ID NO:1和5中列出的核酸序列组成。

根据一些实施方案,所述生物标志包含SEQ ID NO:1且还包含选自SEQ ID NO:3、4、6和14的至少一种核酸序列。每种可能性是本发明的单独的实施方案。

根据一些实施方案,所述生物标志包含SEQ ID NO:1和4以及选自SEQ ID NO:3、6和14的至少一种核酸序列。每种可能性是本发明的单独的实施方案。

根据一些实施方案,所述生物标志包含SEQ ID NO:1、3和4。

根据一些实施方案,所述生物标志包含SEQ ID NO:1、4、6和14。

根据一些实施方案,所述生物标志包含SEQ ID NO:1、3、4和14。

根据一些实施方案,所述生物样品选自由以下组成的组:血液、血浆、唾液、血清或其组合。每种可能性是本发明的单独的实施方案。

根据一些实施方案,所述生物样品为从外周血提取的血浆。

根据一些实施方案,生物标志为循环mRNA。

根据一些实施方案,测量所述生物标志的表达包括选自以下的至少一种核酸分析技术:聚合酶链式反应(PCR)、定量PCR、核酸测序技术、限制性酶切消化、特异性杂交、单链构象多态性测定(SSCP)及电泳分析。每种可能性是本发明的单独的实施方案。

根据一些实施方案,测量所述生物标志的表达包括:从血浆提取mRNA、将所述mRNA逆转录为cDNA以及使用定量PCR测量所述cDNA的表达水平。

根据一些实施方案,提供了一种用于鉴定患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者的方法,所述方法包括:

(a)提供来自受试者的生物样品;

(b)测量所述生物样品中包含SEQ ID NO:2中列出的核酸序列的生物标志的表达水平;以及

(c)鉴定所述生物标志的表达水平高于所述生物标志的截断值,从而将所述受试者鉴定为患有结肠直肠癌或癌前进展期结肠直肠息肉。

根据一些实施方案,所述生物标志包含SEQ ID NO:2且还包含选自SEQ ID NO:1、3、5-7、12和17的至少一种核酸序列。每种可能性是本发明的单独的实施方案。

根据一些实施方案,提供了一种用于鉴定患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者的方法,所述方法包括:

(a)提供来自受试者的生物样品;

(b)测量所述生物样品中包含多种核酸序列的生物标志的表达水平,所述多种包括SEQ ID NO:1及选自SEQ ID NO:2、3、5-7、12和17的至少一种核酸序列;以及

(c)鉴定所述生物标志的表达水平高于所述生物标志的截断值,从而将所述受试者鉴定为患有结肠直肠癌或癌前进展期结肠直肠息肉。

根据一些实施方案,提供了一种用于鉴定患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者的方法,所述方法包括:

(a)提供来自受试者的生物样品;

(b)测量包含多种核酸序列的生物标志的表达水平,所述多种包括SEQ ID NO:6、9和14;以及

(c)鉴定所述生物标志的表达水平高于所述生物标志的截断值,从而将所述受试者鉴定为患有结肠直肠癌或癌前进展期结肠直肠息肉。

根据一些实施方案,方法还包括提供所述生物标志的截断值。根据一些实施方案,方法还包括提供对应于生物标志的每种核酸序列的截断值。根据一些实施方案,方法还包括提供对应于生物标志的多种核酸序列的截断值。

根据一些实施方案,方法还包括治疗患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者。

根据一些实施方案,治疗包括以下的至少一种:施用化疗剂、进行肠切除、应用放射疗法及其组合。每种可能性是本发明的单独的实施方案。

根据一些实施方案,化疗剂选自由以下组成的组:5-氟尿嘧啶、亚叶酸、奥沙利铂、卡培他滨及其组合。每种可能性是本发明的单独的实施方案。

根据一些实施方案,提供了一种用于鉴定患有结肠直肠癌的受试者的试剂盒,所述试剂盒包括:(a)用于测量从受试者获得的生物样品中生物标志的表达水平的工具,所述生物标志包含选自由SEQ ID NO:1至17组成的组的至少一种核酸序列;以及(b)用于确定所述至少一种生物标志的截断值或关于所述至少一种生物标志的截断值的信息的工具,其中至少一种生物标志的表达水平高于所述截断值将所述受试者鉴定为患有结肠直肠癌。

根据一些实施方案,用于测量所述生物标志的表达水平的工具为能够扩增选自由SEQ ID NO:1至17组成的组的至少一种核酸序列的至少一种寡核苷酸、能够与所述至少一种核酸序列杂交的至少一种寡核苷酸、位于所述至少一种核酸序列侧翼的核苷酸引物对及其组合。

根据一些实施方案,能够与所述至少一种核酸序列杂交的至少一种寡核苷酸包含可检测的标记物。

根据一些实施方案,可检测的标记物产生与所述至少一种生物标志的表达水平相关的信号。

根据一些实施方案,可检测的标记物产生光学信号。

根据一些实施方案,所述工具为位于至少一种核酸序列侧翼的核苷酸引物对,且核苷酸引物对包含可检测的标记物。

根据一些实施方案,试剂盒还包括其用于鉴定患有结肠直肠癌的受试者的使用说明书。

本发明的另外的实施方案、特征、优势和适用性的完全范围将从下文提供的详述和附图变得明显。然而,应该理解,尽管指出了本发明的优选实施方案,详述仅通过示例的方式提供,因为根据该详述,在本发明的精神和范围内的多种改变和修改将对本领域技术人员变得明显。

附图简述

图1示出了下文实施例中描述的实验程序的实施方案。

图2描绘了用于管家基因HPRT1(A)和TFRC(B)的每一个的引物的浓度校准曲线。

图3描绘了对于以下6种不同的生物标志,患有结肠直肠癌(癌症)的受试者、患有癌前进展期息肉(进展期息肉)的受试者的真阳性百分比(灵敏度)和健康(正常)亚群的假阳性百分比(一(1)减去特异度)的饼形图:BAD(A;SEQ ID NO:2)、BAMBI(B;SEQ ID NO:3)、NEK6(C;SEQ ID NO:5)、FKBP5(D;SEQ ID NO:7)、EPAS1(E;SEQ ID NO:6)及CHD2(F;SEQ IDNO:1)。

图4展示了两种生物标志组合的归一化的表达水平(每个柱指单个受试者):在健康(正常-纹理灰色)的受试者、患有癌前进展期息肉(癌前-实体灰色)的受试者及患有结肠直肠癌(癌症-实体黑色)的受试者中的(A)COX11、KIAA1199和BAD;且(B)CHD2和EPAS1。

图5为生物标志BAD;BAMBI;CHD2;FKBP5;SASH3;NEK6;EPAS1和KLF9(分别为SEQ IDNO:2、3、1、7、17、5、6和12)的最大值的ROC分析,且在健康(对照)和癌症(CA)中的聚簇模型(cluster-model)的AUC产生75%的灵敏度和93%的特异度。

图6示出了对应于图5的标志的聚簇模型健康(对照)和癌症(CA)的样品分布,其中虚线指示高于85%的特异度和最大约登指数点(Youden index point)(0.84)。

图7为生物标志BAD和NEK6的最大值的ROC分析,且在健康(对照)和癌前(AD)中的聚簇模型的AUC产生60%的灵敏度和87%的特异度。

图8示出了对应于图7的标志的聚簇模型健康(对照)和癌前(AD)的样品分布,其中虚线指示高于85%的特异度和最大约登指数点(2)。

发明详述

本发明提供了应用于鉴定癌前进展期息肉和结肠直肠癌的生物标志及其组合。

因此,本发明涉及用于分析牵涉癌前进展期息肉和结肠直肠癌的血浆生物标志的生物标志和生物标志组合及方法。本发明的生物标志包括对应于SEQ ID NO:75-91中列出的17个基因或其片段,包括SEQ ID NO:1-17中列出的基因片段的一个或更多个mRNA区段。

本发明的公开的方法、试剂盒、生物标志及生物标志组合被设计为筛查并鉴定结肠直肠癌,优选地具有等于或高于60%的灵敏度和等于或高于85%的特异度。

通常,本发明的方法对获得涉及血液样品中的癌前进展期息肉和结肠直肠癌的诊断包括早期诊断的生物标志谱和关于许多不同基因的表达的定量信息是有用的。

生物标志的水平可经电泳或免疫化学测量,其中免疫化学检测可通过放射免疫测定、免疫荧光测定或通过酶联免疫吸附测定来实现。在一些实施方案中,生物标志的水平通过qPCR测量。

用于CRC的目前的分子诊断学尚不足够灵敏以区分癌前进展期息肉与结肠直肠癌。约60%的患者首次就被诊断为患有进展期疾病。因此,在美国,在CRC患者的治疗和管理方面每年花费约$14B。

因此,本文提供的诊断平台克服了目前的CRC诊断的缺陷,所述诊断平台提供高特异度和高灵敏度、以及低成本和改进的患者依从性。

根据一些实施方案,提供了一种用于鉴定患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者的方法,所述方法包括:

(a)提供来自受试者的生物样品;

(b)测量所述生物样品中包含SEQ ID NO:1中列出的核酸序列的生物标志的表达水平;以及

(c)鉴定所述生物标志的表达水平高于所述生物标志的截断值,从而将所述受试者鉴定为患有结肠直肠癌或癌前进展期结肠直肠息肉。

根据一些实施方案,提供了一种用于鉴定患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者的方法,所述方法包括:

(a)提供来自受试者的生物样品;

(b)测量所述生物样品中包含SEQ ID NO:2中列出的核酸序列的生物标志的表达水平;以及

(c)鉴定所述生物标志的表达水平高于所述生物标志的截断值,从而将所述受试者鉴定为患有结肠直肠癌或癌前进展期结肠直肠息肉。

根据一些实施方案,生物标志包含SEQ ID NO:3中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:4中列出的核酸序列。根据一些实施方案,生物标志包含SEQID NO:5中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:6中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:7中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:8中列出的核酸序列。根据一些实施方案,生物标志包含SEQID NO:9中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:10中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:11中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:12中列出的核酸序列。根据一些实施方案,生物标志包含SEQID NO:13中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:14中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:15中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:16中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:17中列出的核酸序列。

根据一些实施方案,生物标志包含选自SEQ ID NO:1-17的多种核酸序列。根据一些实施方案,方法包括测量生物标志的表达水平,并确定选自SEQ ID NO:1-17的每种核酸序列的截断值,其中所述多种的至少一种核酸序列的表达水平高于截断值指示所述受试者为患有结肠直肠癌或癌前进展期结肠直肠息肉。

根据一些实施方案,所述生物标志包含SEQ ID NO:1中列出的核酸序列且还包含SEQ ID NO:2-3、5-7、12和17的至少一种,且所述受试者被鉴定为患有结肠直肠癌。

根据一些实施方案,所述生物标志包含SEQ ID NO:1-3、5-7、12和17中列出的核酸序列且所述受试者被鉴定为患有结肠直肠癌。

根据一些实施方案,所述生物标志由SEQ ID NO:1-3、5-7、12和17中列出的核酸序列组成。

根据一些实施方案,所述生物标志包含SEQ ID NO:1和SEQ ID NO:5。

根据一些实施方案,所述生物标志由SEQ ID NO:1和SEQ ID NO:5组成。

根据一些实施方案,所述生物标志包含SEQ ID NO:1和SEQ ID NO:3。根据一些实施方案,所述生物标志包含SEQ ID NO:1和SEQ ID NO:4。根据一些实施方案,所述生物标志包含SEQ ID NO:1和SEQ ID NO:6。根据一些实施方案,所述生物标志包含SEQ ID NO:1和SEQ ID NO:14。根据一些实施方案,所述生物标志包含SEQ ID NO:1、SEQ ID NO:3和SEQ IDNO:4。根据一些实施方案,所述生物标志包含SEQ ID NO:1、SEQ ID NO:3和SEQ ID NO:6。根据一些实施方案,所述生物标志包含SEQ ID NO:1、SEQ ID NO:3和SEQ ID NO:14。根据一些实施方案,所述生物标志包含SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:6和SEQ ID NO:14。根据一些实施方案,所述生物标志包含SEQ ID NO:1、SEQ ID NO:4和SEQ ID NO:6。根据一些实施方案,所述生物标志包含SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:6和SEQ ID NO:14。根据一些实施方案,所述生物标志包含SEQ ID NO:1、SEQ ID NO:6和SEQ ID NO:14。根据一些实施方案,所述生物标志包含SEQ ID NO:6和SEQ ID NO:9。根据一些实施方案,所述生物标志包含SEQ ID NO:6和SEQ ID NO:14。根据一些实施方案,所述生物标志包含SEQ ID NO:9和SEQ ID NO:14。根据一些实施方案中,所述生物标志包含SEQ ID NO:6、SEQ ID NO:9和SEQ ID NO:14。根据一些实施方案,所述生物标志由以上提及的组合的任何一个组成。

根据一些实施方案,本发明提供了一种用于鉴定患有癌前进展期结肠直肠息肉的受试者的方法,所述方法包括:获得来自受试者的生物样品;测量所述生物样品中包含选自由SEQ ID NO:1至17(表1B)中列出的组的至少一种核酸序列的生物标志的表达水平;以及确定所述至少一种核酸序列的表达水平高于其截断值,从而将受试者鉴定为患有癌前进展期结肠直肠息肉或结肠直肠癌。

根据一些实施方案,确定SEQ ID NO:1的表达水平低于SEQ ID NO:1的截断值、至少一种第一生物标志的表达水平低于所述至少一种第一生物标志的截断值且至少一种第二生物标志的表达水平高于所述至少一种第二生物标志的截断值,将受试者鉴定为患有癌前进展期结肠直肠息肉,其中所述第一生物标志为SEQ ID NO:3-8及10-13和15-17的任一种或更多种,且其中所述第二生物标志包含SEQ ID NO:2、9和14的至少一种。每种可能性是本发明的单独的实施方案。

根据一些实施方案,所述第二生物标志包含SEQ ID NO:2。根据一些实施方案,所述第二生物标志包含SEQ ID NO:9。根据一些实施方案,所述第二生物标志包含SEQ ID NO:14。根据一些实施方案,所述第二生物标志包含SEQ ID NO:2和9。根据一些实施方案,所述第二生物标志包含SEQ ID NO:2和14。根据一些实施方案,所述第二生物标志包含SEQ IDNO:9和14。

根据一些实施方案,如本文使用的术语“癌前进展期息肉”、“癌前”、“进展期腺瘤”、“AD”、“AA”及“息肉”是可互换的并指结肠直肠息肉、赘生性癌前病变或可能发展成恶性肿瘤或腺瘤性息肉的其他异常组织生长或病变。已显示癌前进展期息肉的检测降低了CRC的发生率和死亡率。事实上,约85%的CRC是散发性的并且由腺瘤发展而来。

根据一些实施方案,大于1cm的腺瘤或具有重度异生或绒毛状结构的腺瘤被称为“进展期腺瘤”,并且通常被认为是在筛查中检测的相关度最高的子集。估计由腺瘤发展为CRC需要5至10年。由于大多数CRC病例由癌前病变发展而来,筛查对患者具有显着的临床益处。

根据一些实施方案,“生物标志”包括但不限于以下的一种或更多种:具有特定生物学特性的分子指示物;可用来检测结肠直肠癌的生物化学特征或事实。通常,“生物标志”包括但不限于蛋白、核酸和代谢物,连同它们的多态性、突变、变体、修饰、亚基、片段、蛋白-配体复合物及降解产物、蛋白-配体复合物、元素、相关代谢物、电解质、元素及其他分析物或样品衍生的测量。生物标志还可包括突变的蛋白或突变的核酸。生物标志还可指健康状态的非分析物生理标志,其包括结肠直肠癌的其他临床特征或危险因素,诸如,但不限于年龄、种族及癌症家族史。

如本文使用的,术语“生物标志”指基因或其片段的核酸序列,其表达指示结肠癌或癌前进展期结肠直肠息肉。生物标志可以是代表基因或其片段的mRNA或与其对应的cDNA。生物标志包含SEQ ID NO:1-17的任一种或更多种。根据一些实施方案,生物标志包含SEQ ID NO:75-91的任一种或更多种或其片段,包括但不限于,SEQ ID NO:1-17的任一种或更多种。

根据一些实施方案,如本文使用的术语“核酸序列”和“多核苷酸”可互换使用,并且包括任何长度的脱氧核糖核苷酸或核糖核苷酸的核苷酸或其类似物的聚合形式。以下是多核苷酸的非限制性实例:基因或基因片段、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA),核糖体RNA(rRNA)、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针及引物。多核苷酸可包含修饰的核苷酸,诸如甲基化的核苷酸及核苷酸类似物。核苷酸序列可以被非核苷酸组分中断。在聚合之后,多核苷酸可诸如通过与标记组分缀合被进一步修饰。术语还包括双链分子和单链分子。

RNA为高度不稳定的、易于降解的,并因此在保护性细胞环境以外不太可能是稳定的或可检测的。然而,在正常状态中被高度调控的RNA表达在病理状态,诸如,癌症中变得愈发失调。因此,对RNA表达进行谱系分析对鉴定癌症类型和时期是有用的。

此外,出于以下的许多原因,使用来自血浆的循环RNA用于分析癌症是非常有吸引力的:

(a)取样要求微创性方法(minimally invasive method)(抽取少量的血液);

(b)可重复地且在肿瘤进展期间的任何时间获得取样,允许分析对治疗的响应;

(c)整体的简单性使其适合于在处于风险的无症状群体中使用;以及

(d)注意到结肠癌中的循环肿瘤细胞和循环肿瘤mRNA之间的相关性,并且发现乳腺癌患者的血浆中的mRNA比DNA更敏感。

根据一些实施方案,代表生物标志的核酸序列为循环mRNA。

根据一些实施方案,术语“循环”指在血流中发现的核酸区段。

根据一些实施方案,代表生物标志的核酸序列为对应于循环mRNA的cDNA。

如本文使用的,术语“cDNA”指互补DNA。根据一些实施方案,cDNA指分离的多核苷酸、核酸分子或其任何片段或互补物。根据一些实施方案,cDNA通过重组技术获得或经合成方法来合成,可以是双链的或单链的,代表编码序列和/或非编码的5'和3'序列。

根据一些实施方案,如本文使用的“分析物”指待测量且任选地用于鉴定患有某些疾病或紊乱的亚群的任何物质。换言之,生物标志(分析物)可以是被客观测量和评价的作为正常生物过程、致病过程或对治疗性干预的药理学响应的指标的特征。

根据一些实施方案,术语“结肠癌”指在结肠的组织(大肠的最长部分)中形成的癌症和/或赘生物。通常,结肠癌是腺癌(在产生和释放粘液及其他流体的细胞中引发的癌症)。

根据一些实施方案,术语“直肠癌”指在直肠的组织(在肛门之前的大肠的最后几英寸)中形成的癌症和/或赘生物。

根据一些实施方案,在本发明的上下文中的术语“结肠直肠癌”包括但不限于出现在结肠或直肠中的癌症。

本发明部分地基于以下意外发现:来自受试者的流体(血液)样品或任何排泄物中的不同生物标志及生物标志的不同的集(set)以高特异度和灵敏度鉴定受试者的癌性状态或癌前状态。因此,根据本发明的鉴定是准确并可靠的。此外,由于本发明的生物标志从流体样品(例如,血清、血浆或血液)或从排泄物(例如,粪便或尿液)获得,本发明的方法有利地为非侵入性的。

如本文使用的,术语“鉴定(identification)”、“将受试者鉴定(identifying)为”和“将受试者鉴定(identifies)为患有”是可互换的,并且包括以下的任一种或更多种:筛查结肠直肠癌;检测癌症的存在或癌症的严重程度;癌症的预后;癌症的早期诊断;诊断癌前进展期息肉;癌症的疗效和/或复发;以及用于选择癌症疗法和/或治疗的平台,优化给定的癌症疗法和/或预测疗法对于特定受试者(例如,患者)或亚群的适合性或确定治疗性产品在患者或亚群中的适当的给药。每种可能性是本发明的单独的实施方案。

根据一些实施方案,受试者为人受试者。

根据一些实施方案,从受试者获得的样品为体液或排泄样品,包括但不限于精浆(seminal plasma),血液,外周血,血清,尿液,前列腺液,精液(seminal fluid),精液(semen),皮肤、呼吸道、肠道和泌尿生殖道的外分泌物,泪液,脑脊液,痰,唾液,乳汁,腹膜液,胸膜液,腹膜液,囊液,体腔灌洗液,支气管肺泡灌洗液,生殖系统灌洗液和/或身体的任何其他器官或体内系统的灌洗液及粪便。每种可能性是本发明的单独的实施方案。

根据一些实施方案,获得包含组织或流体的生物样品通过以下收集方法中的任一种或更多种来进行:血液取样、尿液取样、粪便取样、痰取样、胸膜液或腹膜液的抽吸、细针穿刺活检、针穿刺活检、芯针穿刺活检和手术活检以及灌洗液。每种可能性是本发明的单独的实施方案。无论采用何种程序,在获得活检物/样品之后,可确定生物标志的水平,并因此可做出诊断。

根据一些实施方案,从受试者获得的样品为外周血。

根据一些实施方案,如本文使用的术语“外周血”指包含红细胞、白细胞及血小板的血液。通常,样品为循环血液的集合。根据一些实施方案,样品为未隔离(sequester)在淋巴系统、脾、肝或骨髓内的外周血样品。

根据一些实施方案,样品为血浆样品。根据一些实施方案,样品为来源于外周血的血浆样品。

根据一些实施方案,本文描述的多种生物标志任选地包括生物标志的任何亚组合,和/或以至少一种其他生物标志例如已知的生物标志为特征的组合。

根据一些实施方案,如本文描述的,多种生物标志与结肠直肠癌相关。

根据一些实施方案,如本文使用的术语“多种”指至少两种。根据一些实施方案,术语“多种”指至少2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种及17种。

根据一些实施方案,“测量表达水平”包括评价临床或受试者来源的样品内的给定物质(通常为mRNA或cDNA)的存在、不存在、量或相对量(其可以为“有效量”),包括此类物质的定性或定量浓度水平,或以其他方式评价受试者的临床参数的值或分类。

根据一些实施方案,“测量表达水平”包括确定所述多种生物标志的mRNA表达水平或确定对应一种或更多种mRNA生物标志的表达水平的cDNA的量或相对量。

根据一些实施方案,生物标志的截断值指区分健康受试者群体与非健康受试者群体的表达水平。根据一些实施方案,在健康受试者群体中,SEQ ID NO:1至17中列出的每种生物标志的水平低于所述生物标志的每一种的截断值。

根据一些实施方案,截断值为统计学显着的值。根据一些实施方案,截断值的p值为至多0.05。根据一些实施方案,至少一种生物标志的表达水平高于或低于所述至少一种生物标志的所述截断值确定了受试者的CRC状态。

根据一些实施方案,确定每种生物标志的截断值包括测量为健康的、患有癌前进展期息肉或患有结肠直肠癌的大的受试者群体中的所述至少一种生物标志的表达水平。

根据一些实施方案,本发明的方法还包括逆转录每种mRNA生物标志并获得相应的互补DNA(cDNA)。根据一些实施方案,测量每种cDNA的量通过定量聚合酶链式反应(qPCR)进行。

根据一些实施方案,表达水平通过定量实时PCR(qRT-PCR)测量。

根据一些实施方案,优选地选择寡核苷酸对以具有兼容的解链温度(Tm),例如,相差小于7℃、优选地小于5℃、更优选地小于4℃、最优选地小于3℃、理想地在3℃和0℃之间的解链温度。

如本文使用的,定量聚合酶链式反应(qPCR)为一种使用荧光探针定量测量DNA的扩增的方法。该技术利用具有附连至5'末端的荧光探针和附连至3'末端的猝灭物的寡核苷酸探针。在PCR扩增期间,这些探针与位于扩增子中的靶序列杂交,并且当聚合酶复制具有结合的探针的模板时,由于聚合酶5'-核酸酶活性,聚合酶还切割荧光探针。由于猝灭物分子和荧光探针之间的紧密接近通常阻止荧光被检测到,解偶联导致与探针切割循环的数目成比例的荧光强度的增加。

根据一些实施方案,期望的靶序列的区段的长度由引物相对于彼此的相对位置确定,并因此该长度是可控参数。由于靶序列的期望的区段成为混合物中的优势序列(在浓度方面),它们被称为“PCR扩增的”。许多变量可影响PCR的平均效率,所述变量包括,仅举几例,靶DNA长度和二级结构、引物长度和设计、引物和dNTP浓度、以及缓冲液组成。与外源DNA(例如,溢出到实验室表面上的DNA)反应的污染或交叉污染也是主要考虑因素。这些反应条件必须针对每种不同的引物对和靶序列小心优化。

根据一些实施方案,确定生物标志的表达水平可包括经由本领域已知的任何方法以及如本文描述的检测特定核酸序列的表达或表达水平。

根据一些实施方案,确定cDNA或mRNA的量和/或浓度通过采用至少一种探针或至少一种引物,优选地引物对来进行。通常,核酸探针或引物适合于检测本发明的特定生物标志的表达或表达水平。

如本文使用的,“引物”定义了能够与靶序列退火(杂交),从而产生可在适合的条件下作为DNA合成的起始点的双链区域的寡核苷酸。

根据一些实施方案,术语“引物对”在本文中指根据本发明的至少一些实施方案的一对寡核苷酸(oligonucleotide)(寡核苷酸(oligo)),其被选择一起用于通过许多类型的扩增方法中的一种、优选地聚合酶链式反应扩增选择的核酸序列。其他类型的扩增方法包括连接酶链式反应、链置换扩增或基于核酸序列的扩增,如下文更详细地解释的。如本领域通常已知的,寡核苷酸被设计为在选择的条件下与互补序列结合。

根据本发明的一些实施方案,取决于特定的测定形式和特定的需求以及采用的靶基因组,寡核苷酸引物可具有任何适合的长度。任选地,寡核苷酸引物的长度为至少12个核苷酸、优选地在15个和24个分子之间,并且它们可被改变以特别适合于选择的核酸扩增系统。如本领域通常已知的,寡核苷酸引物可通过考虑其与其靶序列杂交的解链点来设计(Sambrook等,1989,Molecular Cloning-A Laboratory Manual,第2版,CSHLaboratories)。

根据一些实施方案,本发明的生物标志的表达水平使用表2中列出的引物确定。

根据一些实施方案,诊断测定的“灵敏度”为测试为阳性的患病个体的百分比(“真阳性”的百分比)。通过测定未检测出的患病个体为“假阴性”。未患病且在测定中测试为阴性的受试者称为“真阴性”。诊断测定的“特异度”为一(1)减去假阳性率,其中“假阳性”率被定义为测试为阳性而没有疾病的那些的比例。尽管特定的诊断方法可能不提供状况的确定性诊断,如果该方法提供有助于诊断的阳性指示其就足够了。

根据一些实施方案,当与正常受试者(例如,未患癌症的健康个体)相比时,本文公开的方法以至少19%的灵敏度、至少97%的特异度区分疾病或状况(特别是结肠直肠癌)。根据一些实施方案,当与正常受试者相比时,该方法以至少44%的灵敏度、至少92%的特异度区分疾病或状况。根据一些实施方案,当与正常受试者相比时,该方法以至少56.5%的灵敏度、至少79%的特异度区分疾病或状况。根据一些实施方案,当与表现出模仿疾病或状况症状的症状的受试者相比时,该方法以至少58%的灵敏度、至少92%的特异度区分疾病或状况。根据一些实施方案,当与正常受试者相比时,该方法以至少66%的灵敏度、至少78%的特异度区分疾病或状况。根据一些实施方案,当与正常受试者相比时,该方法以至少100%的灵敏度、至少85%的特异度区分疾病或状况。根据一些实施方案,当与正常受试者相比时,该方法以至少56.5%的灵敏度、至少79%的特异度区分疾病或状况。根据一些实施方案,当与正常受试者相比时,该方法以至少53%的灵敏度、至少81%的特异度区分癌前进展期息肉,并以至少87.5%的灵敏度、至少81%的特异度区分结肠直肠癌。

根据一些实施方案,术语生物标志的“相对量”指受试者的样品中与特定疾病或状况的诊断一致的生物标志的量。相对量可以是绝对量(例如,微克/ml)或相对量(例如,信号的相对强度)。

根据一些实施方案,单独的生物标志和/或生物标志的组合可任选地用于诊断疾病或状况的发作时间。此类诊断可任选地用于多种状况,包括突然发作的那些状况。

技术人员将理解,将指示物与不良结果的倾向相关联为性能(灵敏度&特异度)分析。例如,大于预设截断值的RNA生物标志表达水平可表示患者患有CRC,而小于或等于预设截断值的RNA生物标志表达水平可指示受试者为健康的或未患有CRC。

另外,生物标志浓度从基线水平的变化可反映疾病的状态或其进展(如果牵涉时间监测)或治疗的治疗效果,而生物标志表达水平中的变化程度可与CRC的严重程度相关。统计学显著性通常通过比较两个或更多个群体,并确定置信区间(CI)和/或p值来确定。

根据一些实施方案,本发明的置信区间(CI)为90%、95%、97.5%、98%、99%、99.5%、99.9%及99.99%,同时优选的p值为小于0.1、0.05、0.025、0.02、0.01、0.005、0.001或小于0.0001。在下文描述了用于鉴定CRC和癌前进展期息肉的示例性统计学检验。

根据一些实施方案,生物样品中的感兴趣的核酸的检测可通过本领域已知的任何方法进行。任选地,感兴趣的核酸的检测通过使用寡核苷酸探针的基于杂交的测定来实现。传统的杂交测定包括PCR、逆转录酶PCR、实时PCR、定量PCR、定量实时PCR、RNA酶保护、原位杂交、引物延伸、斑点印迹或狭线印迹(RNA)及RNA印迹(即,用于RNA检测)。其他检测方法包括含有在试纸条(dipstick)设置上的探针的试剂盒等。

根据一些实施方案,探针可根据许多熟知的方法来标记。可检测标志的非限制性实例包括配体、荧光团、化学发光剂、酶及抗体。与探针一起使用的可以能够增加本发明方法的灵敏度的其他可检测标志包括生物素和放射性核苷酸。普通技术人员将明白,特定标记物的选择决定了它与探针结合的方式。

根据一些实施方案,探针选自表2中列出的探针。

根据一些实施方案,探针寡核苷酸可在合成后通过掺入生物素化的dNTP或rNTP或一些类似的方法(例如,将生物素的补骨脂素衍生物光交联至RNA)、随后添加标记的链霉亲和素(例如,藻红蛋白缀合的链霉亲和素)或等同物来标记。可选地,当使用荧光标记的寡核苷酸探针时,可将荧光素、FAM、丽丝胺、藻红蛋白、罗丹明、Cy2、Cy3、Cy3.5、Cy5、Cy5.5、Cy7、FluorX以及其他附连至寡核苷酸。优选地,本发明的生物标志的检测通过使用TaqMan测定、优选地通过使用组合的报告物和猝灭物分子(Roche Molecular Systems Inc.)来实现。

根据一些实施方案,生物样品中的感兴趣的核酸的检测还可任选地通过基于NAT的测定来实现,所述基于NAT的测定牵涉核酸扩增技术,诸如例如PCR(或其变化形式,诸如例如qPCR)。

选择的或靶核酸序列的扩增可通过许多适合的方法进行。许多扩增技术已被描述并可容易地被改变以适应普通技术人员的特定需求。扩增技术的非限制性实例包括聚合酶链式反应(PCR)、连接酶链式反应(LCR)、链置换扩增(SDA)、基于转录的扩增、q3复制酶系统及NASBA。

根据一些实施方案,来自受试者的核酸样品在有利于扩增最丰富的差异表达的核酸的条件下被扩增。根据一些实施方案,对来自患者的mRNA样品进行逆转录成cDNA。根据一些实施方案,差异表达的核酸的扩增同时进行。本领域技术人员将认识到,此类方法可适应于检测差异表达的蛋白而不是差异表达的核酸序列。

根据一些实施方案,用于实践本发明的核酸(例如,mRNA)可根据熟知的方法获得。

根据一些实施方案,检测还可任选地用芯片或其他此类装置来进行。包括待分析的候选区域的核酸样品任选地被分离、扩增并用报告物基团标记。该报告物基团可以是荧光基团诸如藻红蛋白。然后,使用流体学配置(fluidics station)将标记的核酸与固定化在芯片上的探针一起孵育。在反应完成后,将芯片插入扫描仪并检测杂交的模式。当信号从已被掺入核酸的报告物基团发射时,收集杂交数据,所述核酸现与附连至芯片的探针结合。由于固定化在芯片上的每个探针的序列和位置是已知的,可确定与给定的探针杂交的核酸的身份。

将领会的是,当与自动化设备一起使用时,以上描述的检测方法可被用来既快速又容易地筛查多个样品的疾病和/或病理状况。

根据一些实施方案,提供了用于鉴定生物样品中的结肠直肠癌或癌前进展期结肠直肠息肉的试剂盒,所述试剂盒包含一种或更多种容器,所述容器填充有在包含SEQ IDNO:1中列出的核酸序列的生物标志侧翼的核苷酸引物对,其中所述核苷酸引物对被设计为选择性扩增所述样品中个体基因组的包含生物标志的片段。

根据一些实施方案,核苷酸引物对选自表2中列出的核苷酸引物对。

根据一些实施方案,所述核苷酸引物对包含SEQ ID NO:40和41。

根据一些实施方案,所述生物标志还包含选自SEQ ID NO:2、3、5-7、12和17的至少一种核酸序列,且所述核苷酸引物对分别包含以下的至少一种:SEQ ID NO:30和31、SEQ IDNO:34和35、SEQ ID NO:67和68、SEQ ID NO:49和50、SEQ ID NO:52和53、SEQ ID NO:64和65以及SEQ ID NO:73和74。

根据一些实施方案,所述生物标志包含SEQ ID NO:1-3、5-7、12和17中列出的核酸序列,所述核苷酸引物对包含SEQ ID NO:40和41、SEQ ID NO:30和31、SEQ ID NO:34和35、SEQ ID NO:67和68、SEQ ID NO:49和50、SEQ ID NO:52和53、SEQ ID NO:64和65以及SEQ IDNO:73和74,且所述试剂盒用于鉴定结肠直肠癌。

根据一些实施方案,所述生物标志由SEQ ID NO:1-3、5-7、12和17中列出的核酸序列组成,所述核苷酸引物对包含SEQ ID NO:40和41、SEQ ID NO:30和31、SEQ ID NO:34和35、SEQ ID NO:67和68、SEQ ID NO:49和50、SEQ ID NO:52和53、SEQ ID NO:64和65以及SEQID NO:73和74,且所述试剂盒用于鉴定结肠直肠癌。

根据一些实施方案,所述生物标志包含SEQ ID NO:1和5中列出的核酸序列,所述核苷酸引物对包含SEQ ID NO:95和96以及SEQ ID NO:67和68,且所述受试者被鉴定为患有癌前进展期结肠直肠息肉。

根据一些实施方案,所述生物标志由SEQ ID NO:1和5中列出的核酸序列组成,所述核苷酸引物对包含SEQ ID NO:40和41以及SEQ ID NO:67和68,且所述受试者被鉴定为患有癌前进展期结肠直肠息肉。

根据一些实施方案,所述生物标志包含SEQ ID NO:1以及选自SEQ ID NO:3、4、6和14的至少一种核酸序列,且所述核苷酸引物对分别包含SEQ ID NO:40和41,以及SEQ IDNO:34和35、SEQ ID NO:55和56、SEQ ID NO:49和50、SEQ ID NO:61和62的至少一种。

根据一些实施方案,所述生物标志包含SEQ ID NO:1和4以及选自SEQ ID NO:3、6和14的至少一种核酸序列,且所述核苷酸引物对分别包含SEQ ID NO:40和41以及SEQ IDNO:55和56,以及SEQ ID NO:34和35、SEQ ID NO:49和50、SEQ ID NO:61和62的至少一种。

根据一些实施方案,所述生物标志包含SEQ ID NO:1、3和4,且所述核苷酸引物对包含SEQ ID NO:40和41、SEQ ID NO:34和35以及SEQ ID NO:55和56。

根据一些实施方案,所述生物标志包含SEQ ID NO:1、4、6和14,且所述核苷酸引物对包含SEQ ID NO:40和41、SEQ ID NO:55和56、SEQ ID NO:49和50以及SEQ ID NO:61和62。

根据一些实施方案,所述生物标志包含SEQ ID NO:1、3、4和14,且所述核苷酸引物对包含SEQ ID NO:40和41、SEQ ID NO:34和35、SEQ ID NO:55和56以及SEQ ID NO:61和62。

根据一些实施方案,术语“癌症”和“结肠直肠癌”是可互换的。

根据一些实施方案,癌症为浸润性的。根据其他实施方案,癌症为非浸润性的。根据又其他实施方案,癌症为非转移性的。根据一些实施方案,癌症为转移性的。根据一些实施方案,癌症为结肠直肠癌的转移瘤。

根据一些实施方案,本发明的试剂盒和方法用于监测处于结肠直肠癌高风险的个体,诸如,在过去已被诊断患有局限性疾病、转移性疾病的个体或在遗传上与疾病相关的个体,或具有在过去被诊断患有癌症的一级亲属和二级亲属的家庭成员(family members offirst and second degree)的个体。具有结肠炎性状况诸如溃疡性结肠炎或克罗恩结肠炎病史的个体也可被认为是处于结肠直肠癌高风险群体中的个体。根据本发明的分子诊断可用于监测正经历结肠直肠癌或已针对结肠直肠癌治疗的个体,以便确定癌症是否已被消除。根据本发明的筛查和诊断试剂盒及方法可用于监测已诸如通过遗传筛查和/或家族史被鉴定为有遗传倾向的个体。根据本发明的筛查和诊断试剂盒及方法可以用于监测无症状的个体,无论是否被鉴定为有遗传倾向的。

本发明对鉴定显示出癌症的至少一种症状或特征,例如结肠中息肉的存在的个体是有用的。

根据一些实施方案,本发明用于监测已被鉴定为具有家族医疗史的个体,所述家族医疗史包括罹患结肠直肠癌的亲属。同样地,本发明对监测已被治疗并且肿瘤被去除或以其他方式经历缓解的个体是特别有用的。

根据一些实施方案,本发明还提供了一种用于治疗患有结肠直肠癌的受试者的方法,所述方法包括:鉴定患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者,以及治疗所述受试者,其中治疗包括以下的至少一种:施用化疗剂、进行肠切除、应用放射疗法及其组合。

根据一些实施方案,化疗剂包括但不限于5-氟尿嘧啶、亚叶酸或奥沙利铂或卡培他滨;和/或单克隆抗体,诸如贝伐单抗、西妥昔单抗或帕尼单抗或替代性单克隆抗体,或其组合。每种可能性是本发明的单独的实施方案。

根据一些实施方案,治疗受试者的癌前进展期息肉包括去除所述癌前进展期息肉。

根据一些实施方案,去除所述癌前进展期息肉包括进行以下的一种或更多种:结肠镜检查、柔性乙状结肠镜检查和开放手术。每种可能性是本发明的单独的实施方案。

根据一些实施方案,根据本发明的所述受试者的鉴定、诊断、早期诊断和/或预后使本领域技术人员(即,临床医师或医师)能够确定和/或管理受试者治疗方案。管理受试者治疗包括确定癌性状态(例如,癌症状态)的严重程度。例如,如果癌性状态的严重程度指示手术是适合的,则医师可安排患者进行手术。同样地,如果癌性状态的严重程度指示晚期癌症或者如果状态是急性的,则进一步的行动可能不被批准。此外,如果结果显示治疗已经成功,则另外的管理或治疗可以不是必需的。可选地,如果本发明的方法的结果是不确定的或者存在需要确定状态的理由,则医师可安排更多的诊断测试。因此,被发现具有至少一种生物标志的表达水平高于截断值的患者可经历另外的诊断程序,所述至少一种生物标志的表达水平高于截断值将所述患者鉴定为患有结肠直肠癌。

如本文使用的,“受试者”通常指哺乳动物受试者。哺乳动物受试者可以为人或非人、优选地为人。

根据一些实施方案,健康受试者被定义为未患有通过常规诊断方法确定的结肠直肠疾病或症状、结肠直肠相关的疾病或癌前进展期息肉的受试者。

如上文描写的以及如下文权利要求部分要求保护的本发明的多个实施方案和方面在以下实施例中获得实验性支持。

实施例

实施例1-研究群体和样本制备

至少50岁且被安排结肠镜检查的受试者参与了该研究。为了确保仅平均风险的个体被登记,将以下排除在研究之外:先前的CRC或腺瘤;在先前6个月内的缺铁性贫血或便血(haematochezia)(血液在粪便中);或指示疾病的增加的风险的家族史(患有CRC的两个或更多个一级亲属或在50岁或以下患有CRC的一个或更多个一级亲属;或已知的Lynch综合征或家族性腺瘤性息肉病)。

结肠镜检查程序包括息肉切除术和活检通过委员会认证的内窥镜医师(boardcertified endoscopist)使用用于镇静、监测、成像及设备的筛查标准和部位特定标准来进行。活检和手术样本的组织病理学、诊断程序和分期使用常规程序。来自137名受试者的样品可用于选择进入实验室分析,包括55名正常受试者、47名患有进展期腺瘤以及35名患有CRC。研究组的临床以及组织学参数描述于表1A中。

表1A

在征募用于研究的患者同意之后,在手术或结肠镜检查之前使用收集管(vacutainer)提供约10ml血液。收集的血液保持冷藏直至进一步处理(多达收集后4小时)。

通过离心将血浆与血细胞分离。将血浆用试剂(Invitrogen)匀质化。将每体积的血浆与3.5体积的TRIzol试剂混合。将混合物分进储存微管中并储存在-80℃直至进一步纯化。

总RNA提取根据以下方案进行:将300μl氯仿(119.38g/mol)添加至包含相同个体的TRIzolTM-血浆混合物的四个微管的每一个中。将溶液剧烈混合并在室温孵育10分钟。随后,将混合物在4℃以14,000rpm离心15分钟。将水相转移至新管中并与等体积的氯仿剧烈混合,在室温孵育3分钟,并在4℃以14,000rpm离心15分钟。在离心后,将上层相转移至新的微管中;然后,添加来自RNeasyTM微型试剂盒(Qiagen)的总计1.4ml>TM旋转柱(Qiagen)上,并在23℃、10,000g微离心30秒,并弃去流出液(flow-through)。如以上描述的,装载解冻样品的剩余部分,并将柱离心,直至所有溶液通过RNeasyTM旋转柱过滤。进一步的RNA纯化通过遵循RNeasyTM微型试剂盒操作方案(Qiagen)完成。简言之,将旋转柱用样品装载,并用500μl>TM仪器(Thermo>

为了使用基因表达芯片阵列测试基因表达谱,总RNA使用在冰上解冻的相同个体的TRIzol-血浆混合物来纯化,并且每1ml Trizol添加15mg线性梯度丙烯酰胺(linearacrylamide)和200μl氯仿并剧烈混合。在室温孵育10分钟之后,将混合物在4℃以14000rpm离心15分钟。分离水相,并如以上关于qPCR的RNA样本制备描述的进行进一步的RNA纯化步骤。

为了通过qPCR测试基因表达水平,将10微升血浆RNA用于每个cDNA反应。逆转录酶反应用qScript缓冲液混合物和RT酶进行。将产生的cDNA储存在-20℃。对于使用Affymetrix表达微阵列的基因表达谱分析,cDNA被合成、纯化并经历片段化和生物素标记。

实施例2-表达水平的定量

最初,测试不同亚群中72个基因以确定其表达水平,其中17个基因(表1B)被选择为用于检测结肠直肠癌的生物标志的组。

表1B

随后,将所需体积的cDNA稀释x4,其中2μl用于qPCR。对于典型的qPCR反应,将PerfeCTa qPCR SuperMix(目录号95065,Quanta)与每个基因特异性的正向引物和反向引物(表2)集、水解探针及稀释的cDNA以20μl的终体积一起使用。qPCR在ABI Prism 7900系统中在Quanta的指定条件下在96孔PCR板中进行52个循环。表2中列出的荧光标记的探针包括以下标记物的一种或更多种:在5’末端的FAM(还称为56-FAM)、在3’末端的IABkFQ,并且还可包括N,N-二乙基-4-(4-硝基萘-1-基偶氮)-苯胺(还称为‘ZEN’)。ZEN可在任何位置处被掺入。例如,ZEN可在距离3'末端的位置9、距离3'末端的位置10处或在探针中间(使得从ZEN位置起计数的约相同数目的核苷酸在3'和5'方向上延伸)被掺入。用于归一化的参考基因为人HPRT1和人TFRC。对于每个基因的Δ-ΔCt(delta-delta Ct)及相对定量通过DataAssist v3.0计算。参考基因引物和探针序列如下:hHPRT1基因,正向引物-TATGCTGAGGATTTGGAAAGG(SEQ ID NO:18),反向引物-CATCTCCTTCATCACATCTCG(SEQ ID NO:19;终浓度300nM),探针-添加4个LNA的FAM-TATGGACAGGACTGAACG-3'IABkFQ(SEQ ID NO:20)(终浓度200nM)。hTFRC正向引物-TTGCATATTCTGGAATCCCA(SEQ ID NO:21),反向引物-TCAGTTCCTTATAGGTGTCCATG(SEQ ID NO:22;终浓度500nM),探针-添加5个LNA的FAM-TCTGTGTCCTCGCAAAAA-3'IABkFQ(SEQ ID NO:23)(终浓度250nM)。该过程的示例性流程图示于图1中。

确定用于cDNA的引物和探针终浓度用100倍范围校准曲线以6个cDNA稀释度进行。显示出在R2>0.95的准确度的校准曲线最佳斜率(-3.3)的引物和探针浓度被选择作为用于每个基因的最佳浓度(图2)。

表2

实施例3-数据分析

如图2中示意性例示的,基于特定分子标志及其组合的存在或不存在,通过全结肠镜检查的癌前息肉、结肠腺癌或正常结肠的存在被鉴定。对于所有的统计分析,应用SPSS包,版本21(IBM SPSS Statistics)。

首先,从经历结肠镜检查的受试者收集血液。从而,结肠镜检查的结果和其中采集活检样品的病例的病理报告或癌性病例的病理报告被用作研究组的状态的参考。该方法还用来鉴定可提供进展期腺瘤和癌症疾病状态的最佳生物标志的基因组合。如以上详述的,研究组(表1A)被设计为由正常受试者(n=55)、进展期腺瘤(AA;n=47)及结肠直肠癌(CRC;n=35)的3个受试者组组成。

通过qPCR的基因表达的归一化是基于在血浆中稳定表达的两个参考基因的表达:HPRT1和人TFRC。引物-探针比率针对低RNA量来校准,在3个数量级的cDNA浓度中产生最佳PCR效率(线性动态范围)。

所有PCR结果被记录为通过下式:RQ=2^(-ΔCt)计算的相对量(RQ),其中ΔCt为测量的候选检测物基因标志与参考管家基因hHPRT1和TFRC的Ct之间的差。确定截断值以确保所有健康受试者(正常)低于该截断值。代表性生物标志的截断值列于表3中。

表3

SEQ ID NO:生物标志截断值1CHD2>102BAD>283BAMBI>3.55NEK6>3.36EPAS1>0.257FKBP5>212KLF9>717SASH3>2.6

应用几种分析方法以基于来源于从健康受试者、患有癌前进展期息肉的受试者和患有结肠直肠癌的受试者采集的样品的数据确定疾病的状态。

进一步确立的是,通过采用生物标志的组合,改进了结肠直肠癌的鉴定的灵敏度而不损害特异度。为了在对应于组合中的每种生物标志的表达水平范围的不同值之间进行比较,应用组合数据分析算法。在选择生物标志的组合后,将组合中的每种生物标志的表达水平与其截断值进行比较。代表性生物标志的截断值列于表3中。使用该算法,如果组合中的每种生物标志的表达水平低于其预定的截断值,则将值1分配给生物标志的组合。如果所述组合中的至少一种生物标志的表达水平高于其预定的截断值,则将值2分配给生物标志的组合。所分配的值(1或2)在本文也被称为归一化的表达水平。健康(N)、癌前(AD)及癌症(CA)群体中组合COX11、KIAA1199和BAD(SEQ ID NO:9、14和2;表4A)以及CHD2和EPAS1(SEQID NO:1和6;表4B)的归一化的表达水平分别呈现于图4A和4B中,其中高于截断值的表达水平以粗体呈现(图4A和4B)。

表4A:

表4B:

实施例4-结肠直肠癌的鉴定

为了用至少一种生物标志鉴定结肠直肠癌,选择为最高的针对癌症的生物标志的灵敏度和特异度并且为最小的针对癌前进展期息肉的灵敏度。考虑到具有表达水平高于预定的截断值的生物标志,单个生物标志分析的结果在下文呈现于表5中。例如,如在表5中示出的,CHD2(SEQ ID NO:1)在结肠直肠癌的检测中显示出97%的特异度和19%的灵敏度。

生物标志的组合或亚组可被用于通过应用组合数据分析算法将受试者鉴定为患有结肠直肠癌,而不损害特异度。

如表6中示出的,与单独的每种生物标志的灵敏度相比,组合数据分析可增加两种生物标志BAMBI(SEQ ID NO:3)和HNRNHP3(SEQ ID NO:4)的鉴定的灵敏度。

在表7中示出了,与每种生物标志的灵敏度相比,组合数据分析可增加两种生物标志CHD2(SEQ ID NO:1)和EPAS1(SEQ ID NO:6)的鉴定的灵敏度。

在表8中示出了,与每种生物标志的灵敏度相比,组合数据分析增加了三种生物标志BAMBI(SEQ ID NO:3)、HNRNPH3(SEQ ID NO:4)和CHD2(SEQ ID NO:1)的鉴定的灵敏度。

表5

表6

表7

1组如在表6中的被分配诊断。

表8

2组如在表6中的被分配诊断。

在表9中示出了,与每种生物标志的灵敏度相比,组合数据分析增加了四种生物标志CHD2(SEQ ID NO:1)、EPAS1(SEQ ID NO:6)、HNRNPH3(SEQ ID NO:4)和KIAA1199(SEQ IDNO:13)的鉴定的灵敏度。

表9

3组如在表6中的被分配诊断。

在另一种分析方法中,已定义了qPCR ΔCt结果的两个数据集,癌症-健康和AD-健康。计算了基因之间的关系以及病例-健康组间的基因的分散性量度(dispersionmeasure)。

在癌症-健康数据集中,表3中列出的8个基因之间的相关性揭示了彼此高度相关的两个基因聚簇。聚簇1包括基因CHD2、BAD和BAMB1(分别为SEQ ID NO:1-3),且聚簇2包括基因NEK6、FKBP5和SASH3(分别为SEQ ID NO:5、7和17)。根据这些发现结果,产生了以下特征:

1.Max_BAD_BAMBI_CHD2–该特征对应于来自三个基因CHD2、BAD和BAMBI(分别为SEQ ID NO:1-3)的最大值;

2.Max_FKBP5_SASH3_NEK6–该特征对应于来自三个基因NEK6、FKBP5和SASH3(分别为SEQ ID NO:5、7和17)的最大值。

逻辑回归被用于使用以下四种特征开发癌症-健康的分类模型:

a)Max_BAD_BAMBI_CHD2;

b)Max_FKBP5_SASH3_NEK6;

c)EPAS1;以及

d)KLF9。

分析获得了以下模型方程:

Y~max_BAD_BAMBI_CHD2+5x max_FKBP5_NEK6_SASH3+23x EPAS1–3x KLF9-25。

受试者工作特征(ROC)曲线分析被用来评价模型的分离能力(图5)和收益(yield)(84.3%AUC,95%渐近CI:74.8%-93.9%,P值<0.001)。高于85%特异度的点和最大约登指数点(灵敏度+特异度-1)在点0.84处会合,具有75%的性能灵敏度和93%的特异度(图6)。

病例处理小结在表10中提供:

标签有效的N(listwise)阳性a28阴性b41缺失c27

a-根据非参数假设其基因结果为阳性的受试者

b-其基因结果为阴性的受试者(零假设(null hypothesis):真面积=0.5)

c-其结果缺失的受试者

对于健康-AD数据库,t-检验和/或逐步回归模型被用来选择参与模型构建的特征。选择BAD和NEK6(分别为SEQ ID NO:2和5),并且该模型的方程式如下:

Y~BAD+11x NEK6-48

ROC分析被用来评价模型对健康-AD的分离能力(图7)并产生70.5%AUC(95%渐近CI:58.5%-82.5%,P值<0.001)。高于85%特异度的点和最大约登指数点在点2处会合,具有60%的性能灵敏度和87%的特异度(图8)。

病例处理小总在表11中提供:

标签有效的N(listwise)阳性a38阴性b46缺失c24

a-根据非参数假设其基因结果为阳性的受试者

b-其基因结果为阴性的受试者(零假设:真面积=0.5)

c-其结果缺失的受试者

这些分析强烈证明,尽管纯化的血浆RNA不具有良好的质量,鉴定与进展期腺瘤或结肠直肠癌的检测相关的基因仍然是可能的。

以上具体实施方案的描述将如此完全地揭示本发明的一般性质,使得其他人可以通过应用现有的知识,容易地为各种应用修改和/或调整此类具体实施方案而不需要过度实验且不背离一般概念,且因此,此类调整和修改应当并且预期被包含在本公开的实施方案的等价物的含义和范围内。应理解的是,本文采用的措辞或术语是为了描述而非限制的目的。用于进行各种本公开的功能的工具、材料和步骤可采取多种替代形式而不背离本发明。

序列表

<110> 比奥马卡尔技术有限公司

<120> 用于鉴定癌前结肠直肠息肉和结肠直肠癌的方法及试剂盒

<130> BMC005PCD

<150> US 61/977636

<151> 2014-04-10

<160> 91

<170> PatentIn版本3.5

<210> 1

<211> 138

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 1

ccttacagca acagaaagtg aagggcctaa aaaaactaga gaacttcaag aaaaaagagg 60

acgaaatcaa acaatggtta gggaaagttt ctcctgaaga tgtagaatat ttcaattgcc 120

aacaggagct ggcttcag 138

<210> 2

<211> 137

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 2

aggatgagtg acgagtttgt ggactccttt aagaagggac ttcctcgccc gaagagcgcg 60

ggcacagcaa cgcagatgcg gcaaagctcc agctggacgc gagtcttcca gtcctggtgg 120

gatcggaact tgggcag137

<210> 3

<211> 84

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 3

ccgtgctgct caccaaaggt gaaattcgat gctactgtga tgctgcccac tgtgtagcca 60

ctggttatat gtgtaaatct gagc84

<210> 4

<211> 149

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 4

ggaagaggta tgggaggaca tggctatggt ggagctggtg atgcaagttc aggttttcat 60

ggtggtcatt tcgtacatat gagagggttg ccttttcgtg caactgaaaa tgacattgct 120

aatttcttct caccactaaa tccaatacg 149

<210> 5

<211> 148

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 5

cgccctacta catgtcaccg gagaggatcc atgagaacgg ctacaacttc aagtccgaca 60

tctggtccct gggctgtctg ctgtacgaga tggcagccct ccagagcccc ttctatggag 120

ataagatgaa tctcttctcc ctgtgcca148

<210> 6

<211> 99

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 6

agcctatgaa ttctaccatg cgctagactc cgagaacatg accagaactt gtgcaccaag 60

ggtcaggtag taagtggcca gtaccggatg ctcgcaaag99

<210> 7

<211> 142

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 7

tgaagatgga ggcattatcc ggagaaccaa acggaaagga gagggatatt caaatccaaa 60

cgaaggagca acagtagaaa tccacctgga aggccgctgt ggtggaagga tgtttgactg 120

cagagatgtg gcattcactg tg142

<210> 8

<211> 133

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 8

tggctctcct tgtcattttc caggtatgcc tgtgtcaaga tgaggtcacg gacgattaca 60

tcggagacaa caccacagtg gactacactt tgttcgagtc tttgtgctcc aagaaggacg 120

tgcggaactt taa133

<210> 9

<211> 150

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 9

ccagtggaac tttagacctc agcaaacaga aatatatgtg gtgccaggag agactgcact 60

ggcgttttac agagctaaga atcctactga caaaccagta attggaattt ctacatacaa 120

tattgttcca tttgaagctg gacagtattt150

<210> 10

<211> 145

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 10

caacaccttc caccaatact ctgtgaagct ggggcaccca gacaccctga accaggggga 60

attcaaagag ctggtgcgaa aagatctgca aattttctca agaaggagaa taagaatgaa 120

aaggtcatag aacacatcat ggagg 145

<210> 11

<211> 118

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 11

gtcatcaagc acctgaacag gttcaagttc tttcttcaaa gagtcatcag aataacatgg 60

attgaagaga cttccgaaca cttgctatct cttgctgctg ctgtttcatg gaaggaga 118

<210> 12

<211> 85

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 12

ctcccatctc aaagcccatt acagagtgca tacaggtgaa cggccctttc cctgcacgtg 60

gccagactgc cttaaaaagt tctcc 85

<210> 13

<211> 150

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 13

gttttcaatg agtaccagag aatgacaggc cgggacattg agaagagcat ctgccgggag 60

atgtccgggg acctggagga gggcatgctg gccgtggtga aatgtctcaa gaatacccca 120

gccttctttg cggagaggct caacaaggcc150

<210> 14

<211> 106

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 14

gacccaccca catacatcag ggacctctcc atccatcatg ctgcgtcaca gtccatggct 60

ccaatggctt gttgatcaag gacgttgtgg gctataactc tttggg106

<210> 15

<211> 111

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 15

tctgccacta attcgacatc agtttcatcg aggaaagctg aaaataaata tgcaggaggg 60

aaccccgttt gcgtgcgccc aactcccaag tggcaaaaag gaattggaga a111

<210> 16

<211> 150

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 16

aatgagttcc ttctacagtc agatattgac ttcatcatat tggattggtt ccacgctatc 60

aaaaatgcaa ttgacagatt gccaaaggat tcaagttgtc catcaagaaa cctggaatta 120

ttcaaaatcc aaagatcctc tagcactgaa150

<210> 17

<211> 99

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 17

caggaagatg ggcaagatga tggtgaaggc cctgtcagaa gagatggcag acactctgga 60

ggagggctct gcctccccga catctccaga ctacagcct99

<210> 18

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 18

tatgctgagg atttggaaag g 21

<210> 19

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 19

catctccttc atcacatctc g 21

<210> 20

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 20

tatggacagg actgaacg 18

<210> 21

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 21

ttgcatattc tggaatccca 20

<210> 22

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 22

tcagttcctt ataggtgtcc atg 23

<210> 23

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 23

tctgtgtcct cgcaaaaa 18

<210> 24

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 24

tggccgtggt gaaatgtctc aaga 24

<210> 25

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 25

ggccttgttg agcctctc 18

<210> 26

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 26

gttttcaatg agtaccagag aatgac 26

<210> 27

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 27

cagattgcca aaggattcaa gttgtcca 28

<210> 28

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 28

ttcagtgcta gaggatcttt gg 22

<210> 29

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 29

aatgagttcc ttctacagtc agat 24

<210> 30

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 30

ctggagcttt gccgcatctg c 21

<210> 31

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 31

aggatgagtg acgagtttgt g 21

<210> 32

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 32

ctgcccaagt tccgatcc 18

<210> 33

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 33

ttcgatgcta ctgtgatgct gccc 24

<210> 34

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 34

ccgtgctgct caccaaa 17

<210> 35

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 35

gctcagattt acacatataa ccagtg 26

<210> 36

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 36

tgacctcatc ttgacacagg catacc 26

<210> 37

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 37

ttaaagttcc gcacgtcctt 20

<210> 38

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 38

tggctctcct tgtcattttc c 21

<210> 39

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 39

cgaaatcaaa caatggttag ggaaagtttc tcc 33

<210> 40

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 40

ccttacagca acagaaagtg aag 23

<210> 41

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 41

ctgaagccag ctcctgtt 18

<210> 42

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 42

agcaagtgtt cggaagtctc ttcaatcc 28

<210> 43

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 43

tctccttcca tgaaacagca g 21

<210> 44

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 44

gtcatcaagc acctgaacag 20

<210> 45

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 45

aaaacgccag tgcagtctct cct 23

<210> 46

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 46

ccagtggaac tttagacctc ag 22

<210> 47

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 47

aaatactgtc cagcttcaaa tgg 23

<210> 48

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 48

agagtcacca gaacttgtgc accaa 25

<210> 49

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 49

agcctatgaa ttctaccatg cg 22

<210> 50

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 50

ctttgcgagc atccggta 18

<210> 51

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 51

tcaaacatcc ttccaccaca gcgg 24

<210> 52

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 52

cacagtgaat gccacatctc t 21

<210> 53

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 53

tgaagatgga ggcattatcc g 21

<210> 54

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 54

ttcaggtttt catggtggtc atttcg 26

<210> 55

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 55

ggaagaggta tgggaggaca 20

<210> 56

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 56

cgtattggat ttagtggtga gaag 24

<210> 57

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 57

aaacggggtt ccctcctgca tatt 24

<210> 58

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 58

tctgccacta attcgacatc ag 22

<210> 59

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 59

ctccaattcc tttttgccac tt 22

<210> 60

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 60

cctctccatc catcatacat tctctcgct 29

<210> 61

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 61

gacccaccca catacatcag 20

<210> 62

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 62

cccaaagagt tatagcccac aa 22

<210> 63

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 63

agtgcataca ggtgaacggc cc 22

<210> 64

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 64

ggagaacttt ttaaggcagt ctg 23

<210> 65

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 65

ctcccatctc aaagcccatt 20

<210> 66

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 66

aggatccatg agaacggcta caacttc 27

<210> 67

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 67

tggcacaggg agaagagat 19

<210> 68

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 68

cgccctacta catgtcacc 19

<210> 69

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 69

agctctttga attccccctg gttca 25

<210> 70

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 70

cctccatgat gtgttctatg acc 23

<210> 71

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 71

caacaccttc caccaatact ct 22

<210> 72

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 72

agaagagatg gcagacactc tggagg 26

<210> 73

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 73

aggctgtagt ctggagatgt c 21

<210> 74

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 多核苷酸

<400> 74

caggaagatg ggcaagatga 20

<210> 75

<211> 9374

<212> DNA

<213> 智人(HOMO SAPIENS)

<400> 75

ctcagagctg ggaaggaggc tctagatggc ggctgtgcct tagagagagc gcgctctgct 60

ccctgccttt gcctcacttt acgcaacttt ccctaacttt cgggcagcct cagggggccc 120

ccgtagcccc ctgcctttcc tagggactta ctggggtcga ttcgaacctt tttttgggag 180

aaaagcagct tttaggagct ttcttttcgt gccttgttgg aaagaagcag ccgtactgag 240

agcccaggtc gttgtttttt ccagcttaga agccatggcg cacctccatt tttgtgcgct 300

ctcctaatga ggtttttttt ctttcggacc tgttttagta ttaattattg ctttattttt 360

ttgaccagtt aacatatttg agggttattt tatttatttt tcgtttttta acggaggatt 420

ttgcctttat ttttaattat ttgggatctg atatttttct actagtagat aggactcttg 480

gtttggacat actacatgga tcagtaaata cctgggcaca ggacttcaaa gcaaacacag 540

attccccctc ccccttaata tttaagaatt aaaagatgat gagaaataag gacaaaagcc 600

aagaggagga cagttcgcta cacagcaatg catcgagtca ctcagcctct gaagaagctt 660

cgggttcaga ctcaggcagt cagtcggaaa gtgagcaggg aagtgatcca ggaagtggac 720

atggcagcga gtcgaacagc agctctgaat cttctgagag tcagtcggaa tctgagagcg 780

aatcagcagg ttccaaatcc cagccagtcc tcccagaagc caaagagaag ccagcctcta 840

agaaggaacg gatagctgat gtgaagaaga tgtgggaaga atatcctgat gtttatgggg 900

tcaggcggtc aaaccgaagc agacaagaac catcgcgatt taatattaag gaagaggcaa 960

gtagcgggtc tgagagtggg agcccaaaaa gaagaggcca gaggcagctg aaaaaacaag 1020

aaaaatggaa acaggaaccc tcagaagatg aacaggaaca aggcaccagt gcagagagtg 1080

agccagaaca aaaaaaagta aaagccagaa gacctgtccc cagaagaaca gtgcccaaac 1140

ctcgtgttaa aaagcagccg aagactcagc gtggaaagag aaaaaagcaa gattcttctg 1200

atgaggatga tgatgatgac gaagctccca aaaggcagac tcgtcgaaga gcggctaaaa 1260

acgttagtta caaagaagat gatgactttg agactgactc agatgatctc attgaaatga 1320

ctggagaagg agttgatgaa cagcaagata atagtgaaac tattgaaaag gtcttagatt 1380

caagactggg aaagaaagga gccactggag catctactac tgtatatgcg attgaagcta 1440

atggcgaccc tagtggtgac tttgacactg aaaaggatga aggtgaaatc cagtacctca 1500

tcaagtggaa gggttggtct tacatccaca gcacatggga gagtgaagaa tccttacagc 1560

aacagaaagt gaagggccta aaaaaactag agaacttcaa gaaaaaagag gacgaaatca 1620

aacaatggtt agggaaagtt tctcctgaag atgtagaata tttcaattgc caacaggagc 1680

tggcttcaga gttgaataaa cagtatcaga tagtagaaag agtaatagct gtgaagacaa 1740

gtaaatctac attgggtcaa acagattttc cagctcatag tcggaagccg gcaccctcaa 1800

atgagcccga atatctatgt aaatggatgg gactccccta ttcagagtgt agctgggaag 1860

atgaagccct cattggaaag aaattccaga attgcattga cagcttccac agtaggaaca 1920

actcaaaaac catcccaaca agagaatgca aggccctgaa gcagagacca cgatttgtag 1980

ctttaaagaa acaacctgca tatttaggag gggagaatct ggaacttcga gattatcagc 2040

tagaaggtct aaactggcta gctcattcct ggtgcaaaaa taatagtgta atccttgctg 2100

atgaaatggg cctaggaaag accatccaga ccatatcatt cctctcctac ctgttccacc 2160

aacaccagct gtatggcccc tttcttatag tcgtcccttt atccaccctc acctcatggc 2220

agagagagtt tgaaatctgg gcaccagaga ttaacgtagt ggtttacata ggtgacctga 2280

tgagcagaaa tacgatacgg gaatatgaat ggattcattc ccaaaccaaa agattgaagt 2340

tcaacgcact tataacaaca tatgagatcc tcttgaaaga taagactgtg ctgggcagta 2400

ttaactgggc ctttctggga gtggatgaag cccatcggtt gaagaatgat gactctttat 2460

tgtataaaac tctgattgat ttcaagtcca accataggct cctgattacg gggacccctc 2520

ttcagaattc cctcaaagag ctctggtcct tgctgcactt tattatgccg gagaagtttg 2580

aattttggga agattttgaa gaagaccatg ggaaggggag agaaaatggc taccagagtc 2640

ttcataaggt gctagagcct ttccttctcc ggagagtcaa aaaagatgtg gagaaatccc 2700

ttcctgctaa agtggaacag attctcaggg tggagatgtc agcccttcag aaacagtatt 2760

acaagtggat tctgaccagg aattacaagg ctcttgccaa aggaacaaga ggcagcacat 2820

ctggttttct taatattgtg atggaactga aaaaatgttg caaccactgc tatctgatta 2880

aaccccctga agaaaatgaa agggaaaatg gacaggagat tcttctgtcc ctcataagga 2940

gcagtgggaa gttgatttta ttagacaaac tgttgacaag acttcgagaa agggggaatc 3000

gagtgcttat cttctctcag atggtgagaa tgttggatat cctggctgaa tacctaacta 3060

ttaaacacta tcctttccag cgtctggatg gttccatcaa gggagaaatc cgaaaacagg 3120

cactggacca cttcaatgca gatgggtctg aggacttctg tttcctgctc tcgacaaggg 3180

ctggtggcct gggaatcaat ttggcttcag cggacacagt cgtcatcttt gactctgact 3240

ggaaccccca gaatgacttg caggcacaag cccgagcgca tagaattggt caaaagaagc 3300

aggtaaatat ttaccgctta gttacaaagg ggactgtgga ggaggagatc atagaacggg 3360

ccaaaaagaa gatggtatta gatcatctgg tgattcagcg catggacacc actggccgga 3420

cgatcctgga aaacaactca ggaaggtcca actcaaatcc ttttaataaa gaagagctga 3480

cagctatttt gaaatttgga gcagaggatc tcttcaaaga actggaaggg gaggaatcag 3540

aacctcagga aatggatata gatgaaattt tgcggttggc tgaaacgaga gagaatgaag 3600

tgtcaacaag tgcaacagat gaacttctat cacagtttaa ggttgccaac tttgcaacaa 3660

tggaagatga agaagagcta gaagagcgtc ctcacaagga ctgggatgag atcattccag 3720

aggaacaaag gaaaaaagta gaggaggaag agcggcagaa ggagctagaa gaaatttata 3780

tgctgcctcg aattcggagt tccactaaaa aggctcagac aaatgacagt gactctgaca 3840

ctgagtctaa gaggcaggcc cagagatcct ctgcttctga gagtgaaacg gaagactctg 3900

atgatgacaa gaagccaaag cgcagagggc gtccgaggag tgtgcggaag gacctcgtgg 3960

agggatttac tgatgcagag atccgaaggt tcatcaaggc ttataagaag tttggtctcc 4020

ctcttgaacg gctggagtgc atagcacgtg atgctgagct ggtagataag tcggtggcag 4080

atctgaagcg cctgggtgaa ctgatccaca acagctgtgt gtcagcaatg caggaatacg 4140

aagagcagct gaaagaaaat gccagcgagg gaaaaggacc agggaaaagg agaggtccaa 4200

caatcaagat atccggagtt caggttaatg tgaaatccat tatccaacat gaagaggagt 4260

ttgagatgct gcataaatct atccctgtgg accctgaaga aaaaaaaaaa tactgcttaa 4320

cctgtcgtgt caaagctgca cattttgatg tagagtgggg ggtggaagat gattctcgcc 4380

tgttgctggg gatttatgaa catggctatg gaaactggga gttaattaaa acagacccag 4440

agcttaaatt aactgacaaa attctgccgg tggagacaga taaaaagcct caggggaagc 4500

agctacagac ccgagcggat tacttgttga agctgctcag aaagggtctg gagaagaagg 4560

gggctgtgac aggtggggaa gaggccaaat taaagaagcg gaagcctcgg gtaaagaagg 4620

aaaacaaagt gcccaggctg aaagaggagc atggaattga gctttcatct cctaggcatt 4680

cagataatcc atcagaagag ggagaagtga aagatgatgg cttggaaaaa agtccaatga 4740

aaaaaaaaca gaagaagaaa gagaacaagg agaacaagga gaaacaaatg agttctagga 4800

aagacaaaga aggggacaag gaaagaaaga agtcaaaaga taagaaagag aagcctaaaa 4860

gtggtgatgc caaatcttcg agtaaatcaa agcgatctca gggtcctgtc catattacag 4920

caggaagtga acctgtcccc attggagagg atgaggatga tgatctggac caggagacat 4980

tcagcatatg taaggagagg atgaggcccg tgaaaaaggc actgaaacag ctcgacaaac 5040

ctgacaaggg gctcaacgtg caagaacagc tggaacacac ccggaactgc ctgctgaaaa 5100

tcggagaccg gatagccgag tgccttaaag cctactcaga tcaggagcac atcaaactct 5160

ggaggaggaa cctatggatt tttgtttcca agtttacaga atttgatgct cgaaaactgc 5220

ataagttata caagatggct cataagaaaa ggtctcaaga agaagaggag caaaagaaga 5280

aagacgacgt gactgggggt aagaaaccat ttcgtccaga ggcctcaggc tccagccggg 5340

actctctgat atctcagtcc catacctcac acaaccttca ccctcagaag cctcatttgc 5400

ctgcctccca tggcccacag atgcatggac acccaagaga taactacaat caccccaaca 5460

agagacactt cagtaatgca gatcgaggag actggcagag ggaaagaaag ttcaactatg 5520

gtggtggcaa caacaatcca ccatggggaa gcgacaggca ccatcagtat gagcagcact 5580

ggtacaagga ccaccattat ggggaccggc gacatatgga tgcccaccgt tccggaagct 5640

atcgacccaa caacatgtcc agaaagaggc cttatgacca gtacagcagt gaccgagacc 5700

accggggaca cagagattat tatgacaggc accatcatga ctccaagcgg aggagatccg 5760

atgaatttag gcctcaaaat taccaccagc aggatttccg acgaatgtct gatcaccgcc 5820

ccgctatggg ctaccatggc cagggaccct cagaccatta ccgctctttc cacacagata 5880

aactggggga atataaacag cctctacccc cattgcaccc tgcagtctca gatcctcgct 5940

cacccccttc tcagaaatct cctcacgatt ccaagtcacc cctggatcat aggtctcctt 6000

tggagagatc actagaacag aaaaacaacc cagattataa ctggaatgtt cggaaaacat 6060

aaaggacagc tcgtaaagga gagagtaaga gtcaccaaac acgtggatat ttttggtctg 6120

atcctacagt agccggttat ctagaccagt aagtggagtt ttggacatgc tgctgctgtc 6180

aactcactgg ctgaaggagc acttcaagga atgggaggcc tttcactggg tccagctctg 6240

attcgggtca ccactcctgc actttggcac cccatcccat tccagcctag ttctggcctc 6300

ccactttgac gggcacttgg aggaggagct gactgtgtgt gtaccagctt cactgggatg 6360

tgtttcccca gtcaaggaac aggggatctt cagagtcatg aatgttttct tgccagggtc 6420

agtgttccca ggaccttagt gcatggtcgg ggcaggaact ggtgcatgga ggctgctggg 6480

acctggtgaa cagtgtgtga tttggttgat ttggttcact ctgacatgat ggatgctgct 6540

gatggggagt ggcgagttgg ggcaagcggg tggggacaag cataggactt gaaggggagc 6600

aggtacaccc ctcaaatgtg ttcttgggag aagtgataca ctcggcctca ttatgtgaaa 6660

cctgtgggtg gggttggggt ggagaagtag agagagggca acagcttcca caactgcttc 6720

atctctgcca acactaattt ttcccacact gtctttgtac atttcagagc tttggtctcc 6780

tgagtgggcc tccttttccc actgtgccag ggaaggtagg tttctctggc tgactgagta 6840

ctgtgagtga ggcaacactg atgccagcat gggtcttact tgactgggga gtaggctgag 6900

tgaggggtag ggtggggtag gtggggagta gtgtggccag ggaactggaa tccctggtgg 6960

atttctgatt cctgtggtga gaaggaaagc tacaggacct ggagaagggg atgcagaggc 7020

aggcctgctg accaacttgt tgcaatcaca aaggtggggg tcctggtgca ggcagtgaac 7080

aggcttctaa tgtggggttc agtagtgcca gcaagtgggg gaaactttca gtattgcgct 7140

aggtcaacac ttcctgctgc atttccttcc ctttgcacag cttgaagaaa tagagtagac 7200

agaatcacac atcatgtggt gggcagatgg aaataagtac ctgtggtgaa caagtttcta 7260

ctgtagttgg agatcattag aattgaattc agtttctctt agaatataat caggtataaa 7320

cctaagttaa actttttccc aaacaaggag catccaaaga cacagtgact tgagctatag 7380

atagtaaaaa tcatacgaga gttgaactga gtcaggttta ggaagcaagt ttggttgcat 7440

caattaagca ggctcttttc aattgactga tgctggggcc ttcagtttta ttctcagtat 7500

agattgccag tattgttaag agtatccaaa ggcctttcta gatggagaca gaataactga 7560

cttgaacata cagtgtgcct gtaagtgtcc aggctcagag ctggtgaaaa cccttctgtt 7620

gggcgtgtgc agggttaaac tcctgaagta acttgtgagg acttcagtgc ttgctggtgt 7680

cctgggcagc accatgaatg cctttaccaa gacatgccaa gttggatccc ccgaatgaag 7740

cagatgtggc tgtggtgtga cccttgctcc ctgctacaca gagcatcgca gggctggcct 7800

gtgtggtttc cagatgaggg tctgggtccc ggaagcttgt gttgagagct cagtggaccc 7860

accccgcttg ctgaaccctc acagttcttg gggttgtcca gcctggactt gtagcacaca 7920

tgtcctgaag caaagctccg gtgactgcat gagccacctg gccacagtcc tcccatggag 7980

ggcctgccgt gacgctcagt ggagagggca gggcctgtgt ctccacttag gccacacagt 8040

gatgaggaaa ccacagatgg agcttcttgc cgataatact gactctagcc catgattgcc 8100

ttgcccaagc caaagaggaa ggttaggttg gcttgtcgag cccttgagcg ttgggagatg 8160

gggtgggaag gaggtgagcc cctgcagaga gttgggtagt gtccttcagg aatgaaagga 8220

ggggcaaagg agtcaccaga ggtcctgcat ttccatcagg gtttccacag tcatcagggc 8280

ttctctcttg agttgctgat aggagatgtg agttatgccc agagatgtct tatcgtgagg 8340

aaaaagaaac ttccttttgt tcacatttag gactctcagt gccatatgaa gtagcaaaag 8400

gcagtatcgg ccagatcagt gttacattga ttctaaaatt acagtgtccc cattagacaa 8460

ctattttagg tgctggagta tgtttgaaga gtgtgctggg aaaaaggaag catttcttca 8520

ttgatttaaa tcagtatgaa tattatatgc ctaaataaaa aatttgcaca ggtaaattct 8580

ctcacttgtg aatgggagaa gctgccccag gaatctgtga ggatggtatt ccctggagtc 8640

tggctttgaa agatttcatt gttggtagaa ataacaggtt gagaaagagg gagttagcat 8700

cacctaaaac ctgcacgtga acaagggttg acatgataca ctatggcctt agaaaagggc 8760

caggtgaaac cccaagctaa tcactgcggt ctttcagagc cggacagaca ggtgccagca 8820

gagcccgggg ctcactctcc tttcagtcat tcctcagccc ttcgaaggga agcccaaaca 8880

ctttgcacgc tgtgctgcag acattctggc ctggtgtgtc tgaaagttgc atcagtcctc 8940

acggtgcaaa cacagttgat ttaggaagtc acacaatgac actgaaatcc tacagaccaa 9000

aatccacttg tcagcaggag cagcagccca ggcccagcac cagcggtctt ccggctcctc 9060

tgagggctgc cacgttgggc gaggggagcc atgccaaggg tccaggctgc tttaggccat 9120

ctgtgcccca ctcatctggg gacagatggt ttttctttat tgtaaaattg tggactttta 9180

aaacctgttg actaaacagt aattaattta tatttgtgaa aaatgccact gtcctagtga 9240

tttctgatgt aaataatgtt gtttatatag tatgtattaa attttcctac attgtaaaac 9300

tgctgtactt ttgattcttg tatattaaaa agtgttactg agcattttta gaattgggct 9360

aacaaaaaaa aaaa 9374

<210> 76

<211> 986

<212> DNA

<213> 智人

<400> 76

aactagggcc cggagcccgg ggtgctggag ggaggcggca ggcccgggtc aggggcctcg 60

agatcgggct tgggcccaga gcatgttcca gatcccagag tttgagccga gtgagcagga 120

agactccagc tctgcagaga ggggcctggg ccccagcccc gcaggggacg ggccctcagg 180

ctccggcaag catcatcgcc aggccccagg cctcctgtgg gacgccagtc accagcagga 240

gcagccaacc agcagcagcc atcatggagg cgctggggct gtggagatcc ggagtcgcca 300

cagctcctac cccgcgggga cggaggacga cgaagggatg ggggaggagc ccagcccctt 360

tcggggccgc tcgcgctcgg cgccccccaa cctctgggca gcacagcgct atggccgcga 420

gctccggagg atgagtgacg agtttgtgga ctcctttaag aagggacttc ctcgcccgaa 480

gagcgcgggc acagcaacgc agatgcggca aagctccagc tggacgcgag tcttccagtc 540

ctggtgggat cggaacttgg gcaggggaag ctccgccccc tcccagtgac cttcgctcca 600

catcccgaaa ctccacccgt tcccactgcc ctgggcagcc atcttgaata tgggcggaag 660

tacttccctc aggcctatgc aaaaagagga tccgtgctgt ctcctttgga gggagggctg 720

acccagattc ccttccggtg cgtgtgaagc cacggaaggc ttggtcccat cggaagtttt 780

gggttttccg cccacagccg ccggaagtgg ctccgtggcc ccgccctcag gctccgggct 840

ttcccccagg cgcctgcgct aagtcgcgag ccaggtttaa ccgttgcgtc accgggaccc 900

gagcccccgc gatgccctgg gggccgtgct cactaccaaa tgttaataaa gcccgcgtct 960

gtgccgccga aaaaaaaaaa aaaaaa986

<210> 77

<211> 1732

<212> DNA

<213> 智人

<400> 77

tttacggcgc ggagccggag agacctgggc tggcgcgggc gggagctgcg gcggataccc 60

ttgcgtgctg tggagaccct actctcttcg ctgagaacgg ccgctagcgg ggactgaagg 120

ccgggagccc actcccgacc cggggctagc gtgcgtccct agagtcgagc ggggcaaggg 180

agccagtggc cgccgacggg ggaccgggaa acttttctgg gctcctgggc gcgccctgta 240

gccgcgctcc atgctccggc agcggcccga aacccagccc cgccgctgac ggcgcccgcc 300

gctccgggca gggcccatgc cctgcgcgct ccgggggtcg taggctgccg ccgagccggg 360

gctccggaag ccggcggggg cgccgcggcc gtgcggggcg tcaatggatc gccactccag 420

ctacatcttc atctggctgc agctggagct ctgcgccatg gccgtgctgc tcaccaaagg 480

tgaaattcga tgctactgtg atgctgccca ctgtgtagcc actggttata tgtgtaaatc 540

tgagctcagc gcctgcttct ctagacttct tgatcctcag aactcaaatt ccccactcac 600

ccatggctgc ctggactctc ttgcaagcac gacagacatc tgccaagcca aacaggcccg 660

aaaccactct ggcaccacca tacccacatt ggaatgctgt catgaagaca tgtgcaatta 720

cagagggctg cacgatgttc tctctcctcc caggggtgag gcctcaggac aaggaaacag 780

gtatcagcat gatggtagca gaaaccttat caccaaggtg caggagctga cttcttccaa 840

agagttgtgg ttccgggcag cggtcattgc cgtgcccatt gctggagggc tgattttagt 900

gttgcttatt atgttggccc tgaggatgct tcgaagtgaa aataagaggc tgcaggatca 960

gcggcaacag atgctctccc gtttgcacta cagctttcac ggacaccatt ccaaaaaggg 1020

gcaggttgca aagttagact tggaatgcat ggtgccggtc agtgggcacg agaactgctg 1080

tctgacctgt gataaaatga gacaagcaga cctcagcaac gataagatcc tctcgcttgt 1140

tcactggggc atgtacagtg ggcacgggaa gctggaattc gtatgacgga gtcttatctg 1200

aactacactt actgaacagc ttgaaggcct tttgagttct gctggacagg agcactttat 1260

ctgaagacaa actcatttaa tcatctttga gagacaaaat gacctctgca aacagaatct 1320

tggatatttc ttctgaagga ttatttgcac agacttaaat acagttaaat gtgttatttg 1380

cttttaaaat tataaaaagc aaagagaaga ctttgtacac actgtcacca gggttatttg 1440

catccaaggg agctggaatt gagtacctaa ataaacaaaa atgtgcccta tgtaagcttc 1500

tacatcttga tttattgtaa agatttaaaa gaaatatata tattttgtct gaaatttaat 1560

agtgtctttc ataaatttaa ctgggaaacg tgagacagta catgttaatt atacaaatgg 1620

ccatttgctg ttaataattt gttctcaact ctaggatgtg gcttggtttt tttttttctc 1680

ttttcttttt taaacaagac caagatcttg cttattcttc catgaaaaaa aa 1732

<210> 78

<211> 2427

<212> DNA

<213> 智人

<400> 78

agttctcgct ccgcccccca cttcttgctc gttccctccc atccccccaa gccagtagct 60

gtgctgcgca gctccctaag cggttgtcac cgctggagac ggttgggaga accgttgtgg 120

cgagcgctac acgaggcaaa cgacttctcc cttctttgaa ctggaccccg cgagcaccag 180

agtcggcgta actatcgcct gacaggcatt taaatcaaac ggtattgaga tggattgggt 240

tatgaaacat aatggtccaa atgacgctag tgatgggaca gtacgacttc gtggactacc 300

atttggttgc agcaaagagg aaatagttca gttctttcaa gggttggaaa tcgtgccaaa 360

tgggataaca ttgacgatgg actaccaggg gagaagcaca ggggaggcct tcgtgcagtt 420

tgcttcaaag gagatagcag aaaatgctct ggggaaacac aaggaaagaa tagggcacag 480

gtatattgag atcttcagaa gtagcaggag tgaaatcaaa ggattttatg atccaccaag 540

aagattgctg ggacagcgac cgggaccata tgatagacca ataggaggaa gagggggtta 600

ttatggagct gggcgtggaa gtatgtatga cagaatgcga cgaggaggtg atggatatga 660

tggtggttat ggaggttttg atgactatgg tggctataat aattacggct atgggaatga 720

tggctttgat gacagaatga gagatggaag aggtatggga ggacatggct atggtggagc 780

tggtgatgca agttcaggtt ttcatggtgg tcatttcgta catatgagag ggttgccttt 840

tcgtgcaact gaaaatgaca ttgctaattt cttctcacca ctaaatccaa tacgagttca 900

tattgatatt ggagctgatg gcagagccac aggagaagca gatgtagagt ttgtgacaca 960

tgaagatgca gtagctgcca tgtctaaaga taaaaataac atgcaacatc gatatattga 1020

actcttcttg aattctactc ctggaggcgg ctctggcatg ggaggttctg gaatgggagg 1080

ctacggaaga gatggaatgg ataatcaggg aggctatgga tcagttggaa gaatgggaat 1140

ggggaacaat tacagtggag gatatggtac tcctgatggt ttgggtggtt atggccgtgg 1200

tggtggaggc agtggaggtt actatgggca aggcggcatg agtggaggtg gatggcgtgg 1260

gatgtactga aagcaaaaac accaacatac aagtcttgac aacagcatct ggtctactag 1320

actttcttac agatttaatt tcttttgtat tttaagaact ttataatgac tgaaggaatg 1380

tgttttcaaa atattatttg gtaaagcaac agattgtgat gggaaaatgt tttctgtagg 1440

tttatttgtt gcatactttg acttaaaaat aaatttttat attcaaacca ctgatgttga 1500

tactttttat atactagtta ctcctaaaga tgtgctgcct tcataagatt tgggttgatg 1560

tattttacta ttagttctac aagaagtagt gtggtgtaat tttagaggat aatggttcac 1620

ctctgcgtaa actgcaagtc ttaagcagac atctggaata gagcttgaca aataattagt 1680

gtaacttttt tctttagttc ctcctggaca acactgtaaa tataaagcct aaagatgaag 1740

tggcttcagg agtataaatt cagctaatta tttctatatt attatttttc aaatgtcatt 1800

tatcaggcat agctctgaaa cattgatgat ctaagaggta ttgatttctg aatattcata 1860

attgtgttac ctgggtatga gagtgttgga agctgaattc tagccctaga ttttggagta 1920

aaaccccttc agcacttgac cgaaatacca aaaatgtctc caaaaaattg atagttgcag 1980

gttatcgcaa gatgtcttag agtagggtta aggttctcag tgacacaaga attcagtatt 2040

aagtacatag gtatttacta tggagtataa ttctcacaat tgtattttca gttttctgcc 2100

caatagagtt taaataactg tataaatgat gactttaaaa aaatgtaagc aacaagtcca 2160

tgtcatagtc aataaaaaca atcctgcagt tgggttttgt atctgatccc tgcttggagt 2220

tttagtttaa agaatctata tgtagcaagg aaaaggtgct ttttaatttt aatccctttg 2280

atcaatatgg cttttttcca aattggctaa tggatcaaaa tgaaacctgt tgatgtgaat 2340

tcagttattg aacttgttac ttgtttttgc cagaaatgtt attaataaat gtcattgtgg 2400

gagataatag taaaaaaaaa aaaaaaa 2427

<210> 79

<211> 2645

<212> DNA

<213> 智人

<400> 79

gggcgggcgc gcgggcgcgc gggcccgcgc aggcggtggc ggcggcggcg gaaccgagct 60

gacgggcgtg cggccgctgc gccgcaaact cgtgtgggac gcaccgctcc agccgcccgc 120

gggccagcgc accggtcccc cagcggcagc cgagcccgcc cgcgcgccgt tcgtgccctc 180

gtgaggctgg catgcaggat ggcaggacag cccggccaca tgccccatgg agggagttcc 240

aacaacctct gccacaccct ggggcctgtg catcctcctg acccacagag gcatcccaac 300

acgctgtctt ttcgctgctc gctggcggac ttccagatcg aaaagaagat aggccgagga 360

cagttcagcg aggtgtacaa ggccacctgc ctgctggaca ggaagacagt ggctctgaag 420

aaggtgcaga tctttgagat gatggacgcc aaggcgaggc aggactgtgt caaggagatc 480

ggcctcttga agcaactgaa ccacccaaat atcatcaagt atttggactc gtttatcgaa 540

gacaacgagc tgaacattgt gctggagttg gctgacgcag gggacctctc gcagatgatc 600

aagtacttta agaagcagaa gcggctcatc ccggagagga cagtatggaa gtactttgtg 660

cagctgtgca gcgccgtgga gcacatgcat tcacgccggg tgatgcaccg agacatcaag 720

cctgccaacg tgttcatcac agccacgggc gtcgtgaagc tcggtgacct tggtctgggc 780

cgcttcttca gctctgagac caccgcagcc cactccctag tggggacgcc ctactacatg 840

tcaccggaga ggatccatga gaacggctac aacttcaagt ccgacatctg gtccctgggc 900

tgtctgctgt acgagatggc agccctccag agccccttct atggagataa gatgaatctc 960

ttctccctgt gccagaagat cgagcagtgt gactaccccc cactccccgg ggagcactac 1020

tccgagaagt tacgagaact ggtcagcatg tgcatctgcc ctgaccccca ccagagacct 1080

gacatcggat acgtgcacca ggtggccaag cagatgcaca tctggatgtc cagcacctga 1140

gcgtggatgc accgtgcctt atcaaagcca gcaccacttt gccttacttg agtcgtcttc 1200

tcttcgagtg gccacctggt agcctagaac agctaagacc acagggttca gcaggttccc 1260

caaaaggctg cccagcctta cagcagatgc tgaaggcaga gcagctgagg gaggggcgct 1320

ggccacatgt cactgatggt cagattccaa agtcctttct ttatactgtt gtggacaatc 1380

tcagctgggt caataagggc aggtggttca gcgagccacg gcagccccct gtatctggat 1440

tgtaatgtga atctttaggg taattcctcc agtgacctgt caaggcttat gctaacagga 1500

gacttgcagg agaccgtgtg atttgtgtag tgagcctttg aaaatggtta gtaccgggtt 1560

cagtttagtt cttagtatct tttcaatcaa gctgtgtgct taatttactc tgttgtaaag 1620

ggataaagtg gaaatcattt ttttccgtgg agtggtgatt ctgctaacat ttttatctac 1680

gttttataac ttggtgagtg acgatgagag ccctgcacct ggccagagtg tcacaggcaa 1740

aaggcatcgg gaagcaggag catcttcttg gcagccaggc tgggccatct tctcctggac 1800

acctgctgtg taccaggaac ttcgtcacct ccttgaatgc tggcggttca tttcatgatc 1860

agtgttaagc attttcctcc atgggaagga agcatgggat atagaaaagc gaagggctgt 1920

cctttacaaa ttctggttct gcaacttcct agcgtgactt tgggcttggg caagtttctt 1980

agccgttctg agccttcatt tcctcatctg tacaatgaga ttaatagtac ctatcatcta 2040

ccttcaggat tgctgacaga cagaatttga aataaaatat gcaagttagc taatacaaaa 2100

agtagatgat ccaaaaatgg tagccactca cccttcacaa actgaagtcc atggaccacg 2160

gaagtcgaga attaatgtac acctgtatca tgtgtaggaa accagaaatg tgttccttat 2220

ttcttgttcc caaacaggat taactgtgaa gactaattta taaatgtgaa cctaagaaaa 2280

ctccacctct gaaggaaatc atttgaattt tgtttttgta cgtaaagtta accttccaat 2340

tgtctgagct gtcgtcactg acttcatgac agtctggccc tccagacaag agcagcgctg 2400

gcatcgggca ggtgattcct gacacctgct gcctgcaggc attcactgac caggcctttc 2460

ctggaggaaa cacccagggc cgggcggctg ctgtttccac acgtggactc ggatctgctg 2520

tgacaccgtc agcccgacag tctctccata tgcagccttt cctctgtact tttctccatg 2580

gttgaaataa aacagggtga ctgggagtta cttagaattc atgaagattt taaaaaaaaa 2640

aaaaa 2645

<210> 80

<211> 5184

<212> DNA

<213> 智人

<400> 80

gctttacact cgcgagcgga ccgccacacg ggtccggtgc ccgctgcgct tccgccccag 60

cgctcctgag gcggccgtac aatcctcggc agtgtcctga gactgtatgg tcagctcagc 120

ccggcctccg actccttccg actcccagca ttcgagccac tttttttttt ctttgaaaac 180

tcagaaaagt gactcctttt ccagggaaaa aggaacttgg gttcccttct ctccgtcctc 240

ttttcgggtc tgacagcctc cacccactcc ttccccggac cccgcctccg cgcgcaggtt 300

cctcccagtc acctttctcc acccccgccc ccgcacctag cccgccgcgc gccaccttcc 360

acctgactgc gcggggcgct cgggacctgc gcgcacctcg gaccttcacc acccgcccgg 420

gccgcgggga gcggacgagg gccacagccc cccacccgcc agggagccca ggtgctcggc 480

gtctgaacgt ctcaaagggc cacagcgaca atgacagctg acaaggagaa gaaaaggagt 540

agctcggaga ggaggaagga gaagtcccgg gatgctgcgc ggtgccggcg gagcaaggag 600

acggaggtgt tctatgagct ggcccatgag ctgcctctgc cccacagtgt gagctcccat 660

ctggacaagg cctccatcat gcgactggca atcagcttcc tgcgaacaca caagctcctc 720

tcctcagttt gctctgaaaa cgagtccgaa gccgaagctg accagcagat ggacaacttg 780

tacctgaaag ccttggaggg tttcattgcc gtggtgaccc aagatggcga catgatcttt 840

ctgtcagaaa acatcagcaa gttcatggga cttacacagg tggagctaac aggacatagt 900

atctttgact tcactcatcc ctgcgaccat gaggagattc gtgagaacct gagtctcaaa 960

aatggctctg gttttgggaa aaaaagcaaa gacatgtcca cagagcggga cttcttcatg 1020

aggatgaagt gcacggtcac caacagaggc cgtactgtca acctcaagtc agccacctgg 1080

aaggtcttgc actgcacggg ccaggtgaaa gtctacaaca actgccctcc tcacaatagt 1140

ctgtgtggct acaaggagcc cctgctgtcc tgcctcatca tcatgtgtga accaatccag 1200

cacccatccc acatggacat ccccctggat agcaagacct tcctgagccg ccacagcatg 1260

gacatgaagt tcacctactg tgatgacaga atcacagaac tgattggtta ccaccctgag 1320

gagctgcttg gccgctcagc ctatgaattc taccatgcgc tagactccga gaacatgacc 1380

aagagtcacc agaacttgtg caccaagggt caggtagtaa gtggccagta ccggatgctc 1440

gcaaagcatg ggggctacgt gtggctggag acccagggga cggtcatcta caaccctcgc 1500

aacctgcagc cccagtgcat catgtgtgtc aactacgtcc tgagtgagat tgagaagaat 1560

gacgtggtgt tctccatgga ccagactgaa tccctgttca agccccacct gatggccatg 1620

aacagcatct ttgatagcag tggcaagggg gctgtgtctg agaagagtaa cttcctattc 1680

accaagctaa aggaggagcc cgaggagctg gcccagctgg ctcccacccc aggagacgcc 1740

atcatctctc tggatttcgg gaatcagaac ttcgaggagt cctcagccta tggcaaggcc 1800

atcctgcccc cgagccagcc atgggccacg gagttgagga gccacagcac ccagagcgag 1860

gctgggagcc tgcctgcctt caccgtgccc caggcagctg ccccgggcag caccaccccc 1920

agtgccacca gcagcagcag cagctgctcc acgcccaata gccctgaaga ctattacaca 1980

tctttggata acgacctgaa gattgaagtg attgagaagc tcttcgccat ggacacagag 2040

gccaaggacc aatgcagtac ccagacggat ttcaatgagc tggacttgga gacactggca 2100

ccctatatcc ccatggacgg ggaagacttc cagctaagcc ccatctgccc cgaggagcgg 2160

ctcttggcgg agaacccaca gtccaccccc cagcactgct tcagtgccat gacaaacatc 2220

ttccagccac tggcccctgt agccccgcac agtcccttcc tcctggacaa gtttcagcag 2280

cagctggaga gcaagaagac agagcccgag caccggccca tgtcctccat cttctttgat 2340

gccggaagca aagcatccct gccaccgtgc tgtggccagg ccagcacccc tctctcttcc 2400

atggggggca gatccaatac ccagtggccc ccagatccac cattacattt tgggcccaca 2460

aagtgggccg tcggggatca gcgcacagag ttcttgggag cagcgccgtt ggggccccct 2520

gtctctccac cccatgtctc caccttcaag acaaggtctg caaagggttt tggggctcga 2580

ggcccagacg tgctgagtcc ggccatggta gccctctcca acaagctgaa gctgaagcga 2640

cagctggagt atgaagagca agccttccag gacctgagcg ggggggaccc acctggtggc 2700

agcacctcac atttgatgtg gaaacggatg aagaacctca ggggtgggag ctgccctttg 2760

atgccggaca agccactgag cgcaaatgta cccaatgata agttcaccca aaaccccatg 2820

aggggcctgg gccatcccct gagacatctg ccgctgccac agcctccatc tgccatcagt 2880

cccggggaga acagcaagag caggttcccc ccacagtgct acgccaccca gtaccaggac 2940

tacagcctgt cgtcagccca caaggtgtca ggcatggcaa gccggctgct cgggccctca 3000

tttgagtcct acctgctgcc cgaactgacc agatatgact gtgaggtgaa cgtgcccgtg 3060

ctgggaagct ccacgctcct gcaaggaggg gacctcctca gagccctgga ccaggccacc 3120

tgagccaggc cttctacctg ggcagcacct ctgccgacgc cgtcccacca gcttcactct 3180

ctccgtctgt ttttgcaact aggtatttct aacgccagca cactatttac aagatggact 3240

tacctggcag acttgcccag gtcaccaagc agtggccttt ttctgagatg ctcactttat 3300

tatccctatt tttaaagtac acaattgttt tacctgttct gaaatgttct taaattttgt 3360

aggatttttt tcctccccac cttcaatgac ttctaattta tattatccat aggtttctct 3420

ccctccttct ccttctcaca cacaactgtc catactaaca agtttggtgc atgtctgttc 3480

ttctgtaggg agaagcttta gcttcatttt actaaaaaga ttcctcgtta ttgttgttgc 3540

caaagagaaa caaaaatgat tttgctttcc aagcttggtt tgtggcgtct ccctcgcaga 3600

gcccttctcg tttctttttt aaactaatca ccatattgta aatttcaggg tttttttttt 3660

tttgtttaag ctgactcttt gctctaattt tggaaaaaaa gaaatgtgaa gggtcaactc 3720

caacgtatgt ggttatctgt gaaagttgca cagcgtggct tttcctaaac tggtgttttt 3780

cccccgcatt tggtggattt tttattatta ttcaaaaaca taactgagtt ttttaaaaga 3840

ggagaaaatt tatatctggg ttaagtgttt atcatatata tgggtacttt gtaatatcta 3900

aaaacttaga aacggaaatg gaatcctgct cacaaaatca ctttaagatc ttttcgaagc 3960

tgttaatttt tcttagtgtt gtggacactg cagacttgtc cagtgctccc acggcctgta 4020

cggacactgt ggaaggcctc cctctgtcgg ctttttgcca tctgtgatat gccataggtg 4080

tgacaatccg agcagtggag tcattcagcg ggagcactgc gcgctatccc ctcacattct 4140

ctatgtacta tgtatgtatg tattattatt attgctgcca agagggtctg atggcacgtt 4200

gtggggtcgg ggggtggggc ggggaagtgc tctaactttt cttaaggttt tgttgctagc 4260

ccttcaagtg cactgagcta tgtgactcgg atggtctttc acacggcaca tttggacatt 4320

tccagaacta ccatgagatg gtttagacgg gaattcatgc aaatgagggg tcaaaaatgg 4380

tatagtgacc ccgtccacgt cctccaagct cacgaccttg gagccccgtg gagctggact 4440

gaggaggagg ctgcacagcg ggagagcagc tggtccagac cagccctgca gcccccactc 4500

agccggcagc cagatggccc cgcaaggcct ccagggatgg cccctagcca caggccctgg 4560

ctgaggtctc tgggtcggtc agtgacatgt aggtaggaag cactgaaaat agtgttccca 4620

gagcactttg caactccctg ggtaagaggg acgacacctc tggtttttca ataccaatta 4680

catggaactt ttctgtaatg ggtacaatga agaagtttct aaaaacacac acaaagcaca 4740

ttgggccaac tatttagtaa gcccggatag acttattgcc aaaaacaaaa aatagctttc 4800

aaaagaaatt taagttctat gagaaattcc ttagtcatgg tgttgcgtaa atcatatttt 4860

agctgcacgg cattacccca cacagggtgg cagaacttga agggttactg acgtgtaaat 4920

gctggtattt gatttcctgt gtgtgttgcc ctggcattaa gggcatttta cccttgcagt 4980

tttactaaaa cactgaaaaa tattccaagc ttcatattaa ccctacctgt caacgtaacg 5040

atttcatgaa cgttattata ttgtcgaatt cctactgaca acattataac tgtatgggag 5100

cttaacttta taaggaaatg tattttgaca ctggtatctt attaaagtat tctgatccta 5160

ccactgaaaa aaaaaaaaaa aaaa5184

<210> 81

<211> 3838

<212> DNA

<213> 智人

<400> 81

agtctcgggc ggcggtgtcc ggcgcgcggg cggcctgctg ggcgggctga agggttagcg 60

gagcacgggc aaggcggaga gtgacggagt cggcgagccc ccgcggcgac aggtaccggc 120

gccatggcca cggagatggg gcggccggcc gcggcgcccc gggagccgaa cgccctcctt 180

ccaggttctc tacttaaaag acaatgacta ctgatgaagg tgccaagaac aatgaagaaa 240

gccccacagc cactgttgct gagcagggag aggatattac ctccaaaaaa gacaggggag 300

tattaaagat tgtcaaaaga gtggggaatg gtgaggaaac gccgatgatt ggagacaaag 360

tttatgtcca ttacaaagga aaattgtcaa atggaaagaa gtttgattcc agtcatgata 420

gaaatgaacc atttgtcttt agtcttggca aaggccaagt catcaaggca tgggacattg 480

gggtggctac catgaagaaa ggagagatat gccatttact gtgcaaacca gaatatgcat 540

atggctcggc tggcagtctc cctaaaattc cctcgaatgc aactctcttt tttgagattg 600

agctccttga tttcaaagga gaggatttat ttgaagatgg aggcattatc cggagaacca 660

aacggaaagg agagggatat tcaaatccaa acgaaggagc aacagtagaa atccacctgg 720

aaggccgctg tggtggaagg atgtttgact gcagagatgt ggcattcact gtgggcgaag 780

gagaagacca cgacattcca attggaattg acaaagctct ggagaaaatg cagcgggaag 840

aacaatgtat tttatatctt ggaccaagat atggttttgg agaggcaggg aagcctaaat 900

ttggcattga acctaatgct gagcttatat atgaagttac acttaagagc ttcgaaaagg 960

ccaaagaatc ctgggagatg gataccaaag aaaaattgga gcaggctgcc attgtcaaag 1020

agaagggaac cgtatacttc aagggaggca aatacatgca ggcggtgatt cagtatggga 1080

agatagtgtc ctggttagag atggaatatg gtttatcaga aaaggaatcg aaagcttctg 1140

aatcatttct ccttgctgcc tttctgaacc tggccatgtg ctacctgaag cttagagaat 1200

acaccaaagc tgttgaatgc tgtgacaagg cccttggact ggacagtgcc aatgagaaag 1260

gcttgtatag gaggggtgaa gcccagctgc tcatgaacga gtttgagtca gccaagggtg 1320

actttgagaa agtgctggaa gtaaaccccc agaataaggc tgcaagactg cagatctcca 1380

tgtgccagaa aaaggccaag gagcacaacg agcgggaccg caggatatac gccaacatgt 1440

tcaagaagtt tgcagagcag gatgccaagg aagaggccaa taaagcaatg ggcaagaaga 1500

cttcagaagg ggtcactaat gaaaaaggaa cagacagtca agcaatggaa gaagagaaac 1560

ctgagggcca cgtatgacgc cacgccaagg agggaagagt cccagtgaac tcggcccctc 1620

ctcaatgggc tttcccccaa ctcaggacag aacagtgttt aatgtaaagt ttgttatagt 1680

ctatgtgatt ctggaagcaa atggcaaaac cagtagcttc ccaaaaacag cccccctgct 1740

gctgcccgga gggttcactg aggggtggca cgggaccact ccaggtggaa caaacagaaa 1800

tgactgtggt gtggagggag tgagccagca gcttaagtcc agctcatttc agtttctatc 1860

aaccttcaag tatccaattc agggtccctg gagatcatcc taacaatgtg gggctgttag 1920

gttttacctt tgaactttca tagcactgca gaaaccttta aaaaaaaaat gcttcatgaa 1980

tttctccttt cctacagttg ggtagggtag gggaaggagg ataagctttt gttttttaaa 2040

tgactgaagt gctataaatg tagtctgttg catttttaac caacagaacc cacagtagag 2100

gggtctcatg tctccccagt tccacagcag tgtcacagac gtgaaagcca gaacctcaga 2160

ggccacttgc ttgctgactt agcctcctcc caaagtcccc ctcctcagcc agcctccttg 2220

tgagagtggc tttctaccac acacagcctg tccctggggg agtaattctg tcattcctaa 2280

aacacccttc agcaatgata atgagcagat gagagtttct ggattagctt ttcctatttt 2340

cgatgaagtt ctgagatact gaaatgtgaa aagagcaatc agaattgtgc tttttctccc 2400

ctcctctatt ccttttaggg aataatattc aatacacagt acttcctccc agcattgcta 2460

ctgctcagct tcttctttca ttctaatcct tgctattaag aatttaagac ttgtgcttac 2520

aatatttttg acctggagtg gatctattta catagtcatt taggatccat gcagcttttt 2580

ttgtcttttt aagattattg gctcataagc atatgtatac tggtttatgg aactttattt 2640

acactcctct atcatgcaaa aaaattttga ctttttagta ctaagcttaa tttttaaaaa 2700

caaaatctgt agggttgaca aataaatagt tgctcttcta cactaggggt ttcacctgca 2760

ggtttgacac gcagttgctc gcttttcctg ccctgtcaag cttctctgtt ctggcgtgag 2820

ttgtgaaaga gttgaagaca gcttcccatg ccggtacaca gccagtagcc taaatctcca 2880

gtacttgagc tgaccattga actagggcaa gtcttaaatg tgtacatgta gttgaatttc 2940

agtccttacg ggtaaacaga ttgagcatgg ctctctattc cctcagccta agaaacactc 3000

atgggaatgc atttggcaac ccaaggaacc atttgcttaa acctggaaca tctcaccttt 3060

ttaaatccta aaaaacactg gcagttatat tttaaattag tttttatttt tatgatggtt 3120

ttatcaaaag acttttatta ttagattggg acccccttca aacctaaaaa tcaagttatt 3180

tccttttata atacttttct tccccatgga acaaatggga tcaatttgtg agttttttcc 3240

tttaatgata actaaaatcc ctctaatttc tcatttatgc ttttgtcttt tttatgaaat 3300

atttctttta aaagccccag tctcacctac gaaatatgaa gagcaaaagc tgattttgct 3360

tacttgctaa actgttggga aagctctgta gagcatggtt ccagtgaggc caagattgaa 3420

atttgatact aaaaaggcca cctagctttt tgcagataac aaacaagaaa gctattccaa 3480

gactcagatg atgccagctg tctcccacgt gtgtattatg gttcaccagg gggaactggc 3540

aaaagtgtgt gtggggaggg gaagggtgtg tgagtggttc tgagcaaata actacagggt 3600

gcccattacc actcaagaag acacttcacg tattcttgta tcaaattcaa taatcttaaa 3660

caatttgtgt agaagtccac agacatcttt caaccacctt ttaggctgca tatggattgc 3720

caagtcagca tatgaggaat taaagacatt gtttttaaaa aaaaaaaatc atttagatgc 3780

acttttttgt gtgttcttta aataaatcca aaaaaaatgt gacttccaaa aaaaaaaa 3838

<210> 82

<211> 2207

<212> DNA

<213> 智人

<400> 82

cacttcctcc ccagacaggg gtagtgcgag gccgggcaca gccttcctgt gtggttttac 60

cgcccagaga gcgtcatgga cctggggaaa ccaatgaaaa gcgtgctggt ggtggctctc 120

cttgtcattt tccaggtatg cctgtgtcaa gatgaggtca cggacgatta catcggagac 180

aacaccacag tggactacac tttgttcgag tctttgtgct ccaagaagga cgtgcggaac 240

tttaaagcct ggttcctccc tatcatgtac tccatcattt gtttcgtggg cctactgggc 300

aatgggctgg tcgtgttgac ctatatctat ttcaagaggc tcaagaccat gaccgatacc 360

tacctgctca acctggcggt ggcagacatc ctcttcctcc tgacccttcc cttctgggcc 420

tacagcgcgg ccaagtcctg ggtcttcggt gtccactttt gcaagctcat ctttgccatc 480

tacaagatga gcttcttcag tggcatgctc ctacttcttt gcatcagcat tgaccgctac 540

gtggccatcg tccaggctgt ctcagctcac cgccaccgtg cccgcgtcct tctcatcagc 600

aagctgtcct gtgtgggcat ctggatacta gccacagtgc tctccatccc agagctcctg 660

tacagtgacc tccagaggag cagcagtgag caagcgatgc gatgctctct catcacagag 720

catgtggagg cctttatcac catccaggtg gcccagatgg tgatcggctt tctggtcccc 780

ctgctggcca tgagcttctg ttaccttgtc atcatccgca ccctgctcca ggcacgcaac 840

tttgagcgca acaaggccat caaggtgatc atcgctgtgg tcgtggtctt catagtcttc 900

cagctgccct acaatggggt ggtcctggcc cagacggtgg ccaacttcaa catcaccagt 960

agcacctgtg agctcagtaa gcaactcaac atcgcctacg acgtcaccta cagcctggcc 1020

tgcgtccgct gctgcgtcaa ccctttcttg tacgccttca tcggcgtcaa gttccgcaac 1080

gatctcttca agctcttcaa ggacctgggc tgcctcagcc aggagcagct ccggcagtgg 1140

tcttcctgtc ggcacatccg gcgctcctcc atgagtgtgg aggccgagac caccaccacc 1200

ttctccccat aggcgactct tctgcctgga ctagagggac ctctcccagg gtccctgggg 1260

tggggatagg gagcagatgc aatgactcag gacatccccc cgccaaaagc tgctcaggga 1320

aaagcagctc tcccctcaga gtgcaagccc ctgctccaga agatagcttc accccaatcc 1380

cagctacctc aaccaatgcc aaaaaaagac agggctgata agctaacacc agacagacaa 1440

cactgggaaa cagaggctat tgtcccctaa accaaaaact gaaagtgaaa gtccagaaac 1500

tgttcccacc tgctggagtg aaggggccaa ggagggtgag tgcaaggggc gtgggagtgg 1560

cctgaagagt cctctgaatg aaccttctgg cctcccacag actcaaatgc tcagaccagc 1620

tcttccgaaa accaggcctt atctccaaga ccagagatag tggggagact tcttggcttg 1680

gtgaggaaaa gcggacatca gctggtcaaa caaactctct gaacccctcc ctccatcgtt 1740

ttcttcactg tcctccaagc cagcgggaat ggcagctgcc acgccgccct aaaagcacac 1800

tcatcccctc acttgccgcg tcgccctccc aggctctcaa caggggagag tgtggtgttt 1860

cctgcaggcc aggccagctg cctccgcgtg atcaaagcca cactctgggc tccagagtgg 1920

ggatgacatg cactcagctc ttggctccac tgggatggga ggagaggaca agggaaatgt 1980

caggggcggg gagggtgaca gtggccgccc aaggcccacg agcttgttct ttgttctttg 2040

tcacagggac tgaaaacctc tcctcatgtt ctgctttcga ttcgttaaga gagcaacatt 2100

ttacccacac acagataaag ttttcccttg aggaaacaac agctttaaaa gaaaaagaaa 2160

aaaaaagtct ttggtaaatg gcaaaaaaaa aaaaaaaaaa aaaaaaa 2207

<210> 83

<211> 838

<212> DNA

<213> 智人

<400> 83

ctcgcgagat ttgacctctc gtccctgaga ggcgggtggg tgttagttca gagggttatg 60

ggagggctct ggcgtcctgg atggaggtgc gttcctttct gtggctggcg ctggatccac 120

cctgggtctc caaccagggc tgcagagagg gtagagccgt ttcttaggcc agagtggagt 180

gggacaggag gtgccgagag aggactgagg tggcttggga catggaagcg ctgcagcctt 240

cgagcccggc atccagcatt gcagccgccg cggcggccta agagctcgaa ccctttcaca 300

cgcgcgcagg aggaggagcg gcggcggcag aacaagacga ccctcactta cgtggccgct 360

gtcgccgtgg gcatgctggg ggcgtcctac gctgccgtac ccctttatcg gctctattgc 420

cagactactg gacttggagg atcagcagtt gcaggtcatg cctcagacaa gattgaaaac 480

atggtgcctg ttaaagatcg aatcattaaa attagcttta atgcagatgt gcatgcaagt 540

ctccagtgga actttagacc tcagcaaaca gaaatatatg tggtgccagg agagactgca 600

ctggcgtttt acagagctaa gaatcctact gacaaaccag taattggaat ttctacatac 660

aatattgttc catttgaagc tggacagtat ttcaataaaa tacaggtatt gtcttccagg 720

cttcaaagct gcacagagtc tacgttttag agagttggca cctttgatgt ggtagtgagc 780

tgatcatcca ctttcttcta aaataaagag aagaaaatgg ccagtaaaaa aaaaaaaa 838

<210> 84

<211> 586

<212> DNA

<213> 智人

<400> 84

aaacactctg tgtggctcct cggctttgac agagtgcaag acgatgactt gcaaaatgtc 60

gcagctggaa cgcaacatag agaccatcat caacaccttc caccaatact ctgtgaagct 120

ggggcaccca gacaccctga accaggggga attcaaagag ctggtgcgaa aagatctgca 180

aaattttctc aagaaggaga ataagaatga aaaggtcata gaacacatca tggaggacct 240

ggacacaaat gcagacaagc agctgagctt cgaggagttc atcatgctga tggcgaggct 300

aacctgggcc tcccacgaga agatgcacga gggtgacgag ggccctggcc accaccataa 360

gccaggcctc ggggagggca ccccctaaga ccacagtggc caagatcaca gtggccacgg 420

ccacggccac agtcatggtg gccacggcca cagccactaa tcaggaggcc aggccaccct 480

gcctctaccc aaccagggcc ccggggcctg ttatgtcaaa ctgtcttggc tgtggggcta 540

ggggctgggg ccaaataaag tctcttcctc caagtcaaaa aaaaaa586

<210> 85

<211> 1567

<212> DNA

<213> 智人

<400> 85

cgccccaccc gcgagccgca gccgcggccc cacagcttct ggggctgggg ccccggcagc 60

cgggcaggcc ggcctgacct cgacctccgc cgtgcgggcc cgaccggtga gtccagcccg 120

gcagtcgcag gacccggccg ccagcctctc cctccacctc tccctgcccc cagcgccagg 180

cgcgggctgc gctcggtggc ggcggcgggg ccctcaggcg gccatggcgg caggcgccgg 240

ggccgggtcc gcgccgcgct ggctgagggc gctgagcgag ccgctgagcg cggcgcagct 300

gcggcgactg gaggagcacc gctacagcgc ggcgggcgtc tcgctgctcg agccgccgct 360

gcagctctac tggacctggc tgctccagtg gatcccgctc tggatggccc ccaactccat 420

caccctgctg gggctcgccg tcaacgtggt caccacgctc gtgctcatct cctactgtcc 480

cacggccacc gaagaggcac catactggac atacctttta tgtgcactgg gactttttat 540

ttaccagtca ctggatgcta ttgatgggaa acaagccaga agaacaaact cttgttcccc 600

tttaggggag ctctttgacc atggctgtga ctctctttcc acagtattta tggcagtggg 660

agcttcaatt gccgctcgct taggaactta tcctgactgg ttttttttct gctcttttat 720

tgggatgttt gtgttttatt gcgctcattg gcagacttat gtttcaggca tgttgagatt 780

tggaaaagtg gatgtaactg aaattcagat agctttagtg attgtctttg tgttgtctgc 840

atttggagga gcaacaatgt gggactatac gattcctatt ctagaaataa aattgaagat 900

ccttccagtt cttggatttc taggtggagt aatattttcc tgttcaaatt atttccatgt 960

tatcctccat ggtggtgttg gcaagaatgg atccactata gcaggcacca gtgtcttgtc 1020

acctggactc cacataggac taattattat actggcaata atgatctata aaaagtcagc 1080

aactgatgtg tttgaaaagc atccttgtct ttatatccta atgtttggat gtgtctttgc 1140

taaagtctca caaaaattag tggtagctca catgaccaaa agtgaactat atcttcaaga 1200

cactgtcttt ttggggccag gtcttttgtt tttagaccag tactttaata actttataga 1260

cgaatatgtt gttctatgga tggcaatggt gatttcttca tttgatatgg tgatatactt 1320

tagtgctttg tgcctgcaaa tttcaagaca ccttcatcta aatatattca agactgcatg 1380

tcatcaagca cctgaacagg ttcaagttct ttcttcaaag agtcatcaga ataacatgga 1440

ttgaagagac ttccgaacac ttgctatctc ttgctgctgc tgtttcatgg aaggagatat 1500

taaacatttg tttaattttt atttaagtgt tatacctatt tcagcaaata aaatatttca 1560

ttgctta 1567

<210> 86

<211> 5208

<212> DNA

<213> 智人

<400> 86

cttactcatt tgtgtttatt cttggactta tcctgacata atggggtttt tttaattata 60

gattcacact gcatttattc atcacccctg tcctctcatc cataactcaa atttactacc 120

agcaacacaa aatacaaaga tgtgtccagt ttcactacag ctcttcgcgt ttacaagtgt 180

cgagcgcttg ctttcggaac gcccttgtga ttggccgagc caatgccagt gacatcaacc 240

aacttacttt tgattggaag gctggttgct gggactgtag cgtttgcagg aagtcactta 300

actgtttggg agctggaaaa ccgaagctga agttctcttt tgccatagga acgagcgcaa 360

ctgactagga aagatgtgtc ccaaagctcc gcaagctgga acgtgagcca ggaggcccgg 420

accggccacg ggaccgcgag gcactccgaa agtgtgcggc tgccccttcc ctgcctccca 480

gctgttaccc ttttaaatgt cagtgttcga ggctgtaggg gtagcacgag gcagcgaaac 540

ggaacagtcg gattggccgc acgcctcagt tctagacgca cctctccacc gaaggccgtt 600

ctgactggca gggggagaaa gtaaacagag ttgaatcacc ctccccactg gccaattgga 660

gggggtttgg tttgtgacgt gatgggattc tgcgaaattg ttactgagca agagaatgcc 720

ggaacggtgc ggaccggccg gagcaggggt tcagaagccg tcagtggact cgggaaaaag 780

tgtctcttag acctggcgct cggcgggacc ctcgccaccc gcgtcggggt gatcgggtga 840

atgtcctggg gctttggctc gacggcgagg cggccgaggg cgtgcacctc tcttgcagtt 900

tcctctccca gcgcctcggg ggcgttttca gtcgaataaa cttgcgaccg ccacgtgtgg 960

catctttcca agggagccgg ctcagagggg ccggcgcgcc cgtcggggga tcgcggccgg 1020

cgcggggcag gggcggcggc tagaggcggc ggcgcggcgg agcccggggc cgtggatgct 1080

gcgtgcggag gcgctgccgg ttacgtaaag atgaggggct gaggtcgcct cggcgctcct 1140

gcgagtcgga agcgccccgc gcccccgccc ccttggccgc cgcgccgtgc cgcgccgcgc 1200

cgcgctcgtc gtccgaggcc agggcagggc gagccgaacc tccgcagcca ccgccaagtt 1260

tgtccgcgcc gcctgggctg ccgtcgcccg caccatgtcc gcggccgcct acatggactt 1320

cgtggctgcc cagtgtctgg tttccatttc gaaccgcgct gcggtgccgg agcatggggt 1380

cgctccggac gccgagcggc tgcgactacc tgagcgcgag gtgaccaagg agcacggtga 1440

cccgggggac acctggaagg attactgcac actggtcacc atcgccaaga gcttgttgga 1500

cctgaacaag taccgaccca tccagacccc ctccgtgtgc agcgacagtc tggaaagtcc 1560

agatgaggat atgggatccg acagcgacgt gaccaccgaa tctgggtcga gtccttccca 1620

cagcccggag gagagacagg atcctggcag cgcgcccagc ccgctctccc tcctccatcc 1680

tggagtggct gcgaagggga aacacgcctc cgaaaagagg cacaagtgcc cctacagtgg 1740

ctgtgggaaa gtctatggaa aatcctccca tctcaaagcc cattacagag tgcatacagg 1800

tgaacggccc tttccctgca cgtggccaga ctgccttaaa aagttctccc gctcagacga 1860

gctgacccgc cactaccgga cccacactgg ggaaaagcag ttccgctgtc cgctgtgtga 1920

gaagcgcttc atgaggagtg accacctcac aaagcacgcc cggcggcaca ccgagttcca 1980

ccccagcatg atcaagcgat cgaaaaaggc gctggccaac gctttgtgag gtgctgcccg 2040

tggaagccag ggagggatgg accccgaaag gacaaaagta ctcccaggaa acagacgcgt 2100

gaaaactgag ccccagaaga ggcacacttg acggcacagg aagtcactgc tctttggtca 2160

atattctgat tttcctctcc ctgcattgtt tttaaaaagc acattgtagc ctaagatcaa 2220

agtcaacaac actcggtccc cttgaagagg caactctctg aacccgtctc tgactgttgg 2280

agggaaggca aatgcttttg ggttttttgg tttttgtttt tgtttttttt tctcctttta 2340

tttttttgcg ggggagggta gggagtgggt gggggggagg ggggtaaggc caagactggg 2400

gtagaatttt aaagattcaa cactggtgta catatgtccg ctgggtgagt tgacctgtgg 2460

cctcgcacag tgattctggg ccctttatgc ttgctgtctc tcagaattgt tttcttacct 2520

tttaatgtaa tgacgagtgt gcttcagttt gtttagcaaa accactctct tgaatcacgt 2580

taacttttga gattaaaaaa aaaaacgcca tagcacagct gtctttatgc aagcaagagc 2640

acatctactc cagcatgatc tgtcatctaa agacttgaaa acaaaaaaca gttacttata 2700

gtcaatgggt aagcagagtc tgaatttata ctaatcaaga caaacctttg aaaggttaca 2760

ctaagtacag aacttttaaa ccttgctttg tatgagttgt actttttgaa cataagctgc 2820

acttttattt tctaatgcag aggatgaata agttaaatac atgctttgag gatagaagca 2880

gatgttctgt ttggcaccac gttataatct gcttatttta caatatacac gtttccctaa 2940

gaaatcatgg cagagatgtg agggcagaat atacacaaca gatgctgaag gagaaggagg 3000

gtagtgtttt gcaaaagaaa aagaaaagaa ccaacagaat tttaactcta ttaacttttc 3060

caaattttcc tatgctttta gttaacatca ttattgtatc ctaatgccac taggggagag 3120

agcttttgac tctgttgggt tttatttgaa tgtgtgcata acagtaatga gatctggaaa 3180

cacctatttt ttggggaaaa aggtttgttg gtctccttcc tgtgttccta caaaactccc 3240

actctcaggt gcaagagtta tgtagaagga aagggagctg aaataggaac agaaaaatca 3300

acccctataa ctagtgaaca ccaagggaaa ataccacaat gatttcagag gagactctgc 3360

aaaatcgtcc cttgtggaga atgcaggcaa catggaatac taggaatgaa atcacatcac 3420

tgtatctttt acatcaatag cctcaccact aatatatctt gtatctaggt gtctataatg 3480

gctgaaacca ctacatccat ctatgccatt tacctgaaaa cttaactgtg gcctttatga 3540

ggccagaaaa gtgaactgag ttttcgtagt taagacctca aatgagggga gtcagcagtg 3600

atcatggggg aaatgtttac attttttttt tcttcagaag taacgctttc tgatgatttt 3660

atctgatatt taaaacaggg agctatggtg cactctagtt tatacttgcg ctctgaaatg 3720

tgtaaacata gggtgcctac ctatttcacc tgacccatac tcgtttctga ttcagaatca 3780

gtgtgggctc ctgcagtggg cgcgggtcac ggctgactcc aacttccaat acaacagcca 3840

tcactagcac agtgtttttt tgtttaacca acgtagttgt attagtagtt ctataaagag 3900

aactgctttt aacattaggg actgggagca gtccatggga taaaaaggaa agtgttttct 3960

cacgagaaaa catgtcagga aaaataaaga acactttcta cctctgtttc agatttttga 4020

aacacttatt ttaaaccaaa ttttaatttc tgtgtccaaa ataagtttta aggacatctg 4080

ttcttccata cgaaataggt taggctgcct atttctcact gagctcatgg aatggttctg 4140

cttatgatac tctgcacgct gccttttagt gagtgaggag tttggggttg cctagcaact 4200

tgctaacttg taaaaagtca tctttccctc acagaaagaa acgaaagaaa gcaaagcaaa 4260

gtcagtgaaa gacaatcttt atagtttcag gagtaaatct aaatgtggct tttgtcaagc 4320

acttagatgg atataaatgc agcaacttgt tttaaaaaaa tgcacaattt acttcccaaa 4380

aaagttgtta cttgcctttt caagttgttg acaaacacac atttgatatt ctcttatatg 4440

ttatagtaat gtaacgtata aactcaagcc tttttattct ttgtgattaa atcctgtttt 4500

aaaatgtcac aaaacaggaa ccagcattct aattagattt actatatcaa gatatggttc 4560

aaataggact actagagttc attgaacact aaaactatga aacaattact ttttatatta 4620

aaaagaccat ggatttaact tatgaaaatc caaatgcagg atagtaattt ttgtttactt 4680

ttttaaccaa actgaatttt tgaaagacta ttgcaggtgt ttaaaaagaa agaaaagttg 4740

ttttatctaa tactgtaagt agttgtcata ttctggaaaa tttaatagtt ttagagttaa 4800

gatatctcct ctctttggtt agggaagaag aaagcccttc accattgtgg aatgatgccc 4860

tggctttaag gtttagctcc acatcatgct tctcttgaga attctatttg gtagttacaa 4920

ttacagaaac tgattagttt gtcagtttgc agatagattt agcacagtac tcatcactcg 4980

gatagattga gatgttcttt cacatcagat gatctgtaac actgtaagat actgatcttt 5040

acaactgttt aatcagtttt atttttgtac agtattagtg acctaagtta ttttgctgtc 5100

ccgtttttgt aaatcaaatg aaattataaa agaggattct gacagtaggt attttgtaca 5160

tatgtatata tgttgtccaa ataaaaataa taaatgataa agactgaa5208

<210> 87

<211> 2535

<212> DNA

<213> 智人

<400> 87

gcactgcctc tggcacctgg ggcagccgcg cccgcggagt tttccgcccg gcgctgacgg 60

ctgctgcgcc cgcggctccc cagtgccccg agtgccccgc gggccccgcg agcgggagtg 120

ggacccagcc cctaggcaga acccaggcgc cgcgcccggg acgcccgcgg agagagccac 180

tcccgcccac gtcccatttc gcccctcgcg tccggagtcc ccgtggccag gtgtgtgtct 240

ggggaagaga cttacagaag tggagttgct gagtcaaaga tctaaccatg agctaccctg 300

gctatccccc gcccccaggt ggctacccac cagctgcacc aggtggtggt ccctggggag 360

gtgctgccta ccctcctccg cccagcatgc cccccatcgg gctggataac gtggccacct 420

atgcggggca gttcaaccag gactatctct cgggaatggc ggccaacatg tctgggacat 480

ttggaggagc caacatgccc aacctgtacc ctggggcccc tggggctggc tacccaccag 540

tgccccctgg cggctttggg cagcccccct ctgcccagca gcctgttcct ccctatggga 600

tgtatccacc cccaggagga aacccaccct ccaggatgcc ctcatatccg ccatacccag 660

gggcccctgt gccgggccag cccatgccac cccccggaca gcagccccca ggggcctacc 720

ctgggcagcc accagtgacc taccctggtc agcctccagt gccactccct gggcagcagc 780

agccagtgcc gagctaccca ggatacccgg ggtctgggac tgtcaccccc gctgtgcccc 840

caacccagtt tggaagccga ggcaccatca ctgatgctcc cggctttgac cccctgcgag 900

atgccgaggt cctgcggaag gccatgaaag gcttcgggac ggatgagcag gccatcattg 960

actgcctggg gagtcgctcc aacaagcagc ggcagcagat cctactttcc ttcaagacgg 1020

cttacggcaa ggatttgatc aaagatctga aatctgaact gtcaggaaac tttgagaaga 1080

caatcttggc tctgatgaag accccagtcc tctttgacat ttatgagata aaggaagcca 1140

tcaagggggt tggcactgat gaagcctgcc tgattgagat cctcgcttcc cgcagcaatg 1200

agcacatccg agaattaaac agagcctaca aagcagaatt caaaaagacc ctggaagagg 1260

ccattcgaag cgacacatca gggcacttcc agcggctcct catctctctc tctcagggaa 1320

accgtgatga aagcacaaac gtggacatgt cactcgccca gagagatgcc caggagctgt 1380

atgcggccgg ggagaaccgc ctgggaacag acgagtccaa gttcaatgcg gttctgtgct 1440

cccggagccg ggcccacctg gtagcagttt tcaatgagta ccagagaatg acaggccggg 1500

acattgagaa gagcatctgc cgggagatgt ccggggacct ggaggagggc atgctggccg 1560

tggtgaaatg tctcaagaat accccagcct tctttgcgga gaggctcaac aaggccatga 1620

ggggggcagg aacaaaggac cggaccctga ttcgcatcat ggtgtctcgc agcgagaccg 1680

acctcctgga catcagatca gagtataagc ggatgtacgg caagtcgctg taccacgaca 1740

tctcgggaga tacttcaggg gattaccgga agattctgct gaagatctgt ggtggcaatg 1800

actgaacagt gactggtggc tcacttctgc ccacctgccg gcaacaccag tgccaggaaa 1860

aggccaaaag aatgtctgtt tctaacaaat ccacaaatag ccccgagatt caccgtccta 1920

gagcttaggc ctgtcttcca cccctcctga cccgtatagt gtgccacagg acctgggtcg 1980

gtctagaact ctctcaggat gccttttcta ccccatccct cacagcctct tgctgctaaa 2040

atagatgttt catttttctg actcatgcaa tcattcccct ttgcctgtgg ctaagacttg 2100

gcttcatttc gtcatgtaat tgtatatttt tatttggagg catattttct tttcttacag 2160

tcattgccag acagaggcat acaagtctgt ttgctgcata cacatttctg gtgagggcga 2220

ctgggtgggt gaagcaccgt gtcctcgctg aggagagaaa gggaggcgtg cctgagaagg 2280

tagcctgtgc atctggtgag tgtgtcacga gctttgttac tgccaaactc actccttttt 2340

agaaaaaaca aaaaaaaagg gccagaaagt cattccttcc atcttccttg cagaaaccac 2400

gagaacaaag ccagttccct gtcagtgaca gggcttcttg taatttgtgg tatgtgcctt 2460

aaacctgaat gtctgtagcc aaaacttgtt tccacattaa gagtcagcca gctctggaat 2520

ggtctggaaa tgtca2535

<210> 88

<211> 7080

<212> DNA

<213> 智人

<400> 88

gagctagcgc tcaagcagag cccagcgcgg tgctatcgga cagagcctgg cgagcgcaag 60

cggcgcgggg agccagcggg gctgagcgcg gccagggtct gaacccagat ttcccagact 120

agctaccact ccgcttgccc acgccccggg agctcgcggc gcctggcggt cagcgaccag 180

acgtccgggg ccgctgcgct cctggcccgc gaggcgtgac actgtctcgg ctacagaccc 240

agagggagca cactgccagg atgggagctg ctgggaggca ggacttcctc ttcaaggcca 300

tgctgaccat cagctggctc actctgacct gcttccctgg ggccacatcc acagtggctg 360

ctgggtgccc tgaccagagc cctgagttgc aaccctggaa ccctggccat gaccaagacc 420

accatgtgca tatcggccag ggcaagacac tgctgctcac ctcttctgcc acggtctatt 480

ccatccacat ctcagaggga ggcaagctgg tcattaaaga ccacgacgag ccgattgttt 540

tgcgaacccg gcacatcctg attgacaacg gaggagagct gcatgctggg agtgccctct 600

gccctttcca gggcaatttc accatcattt tgtatggaag ggctgatgaa ggtattcagc 660

cggatcctta ctatggtctg aagtacattg gggttggtaa aggaggcgct cttgagttgc 720

atggacagaa aaagctctcc tggacatttc tgaacaagac ccttcaccca ggtggcatgg 780

cagaaggagg ctattttttt gaaaggagct ggggccaccg tggagttatt gttcatgtca 840

tcgaccccaa atcaggcaca gtcatccatt ctgaccggtt tgacacctat agatccaaga 900

aagagagtga acgtctggtc cagtatttga acgcggtgcc cgatggcagg atcctttctg 960

ttgcagtgaa tgatgaaggt tctcgaaatc tggatgacat ggccaggaag gcgatgacca 1020

aattgggaag caaacacttc ctgcaccttg gatttagaca cccttggagt tttctaactg 1080

tgaaaggaaa tccatcatct tcagtggaag accatattga atatcatgga catcgaggct 1140

ctgctgctgc ccgggtattc aaattgttcc agacagagca tggcgaatat ttcaatgttt 1200

ctttgtccag tgagtgggtt caagacgtgg agtggacgga gtggttcgat catgataaag 1260

tatctcagac taaaggtggg gagaaaattt cagacctctg gaaagctcac ccaggaaaaa 1320

tatgcaatcg tcccattgat atacaggcca ctacaatgga tggagttaac ctcagcaccg 1380

aggttgtcta caaaaaaggc caggattata ggtttgcttg ctacgaccgg ggcagagcct 1440

gccggagcta ccgtgtacgg ttcctctgtg ggaagcctgt gaggcccaaa ctcacagtca 1500

ccattgacac caatgtgaac agcaccattc tgaacttgga ggataatgta cagtcatgga 1560

aacctggaga taccctggtc attgccagta ctgattactc catgtaccag gcagaagagt 1620

tccaggtgct tccctgcaga tcctgcgccc ccaaccaggt caaagtggca gggaaaccaa 1680

tgtacctgca catcggggag gagatagacg gcgtggacat gcgggcggag gttgggcttc 1740

tgagccggaa catcatagtg atgggggaga tggaggacaa atgctacccc tacagaaacc 1800

acatctgcaa tttctttgac ttcgatacct ttgggggcca catcaagttt gctctgggat 1860

ttaaggcagc acacttggag ggcacggagc tgaagcatat gggacagcag ctggtgggtc 1920

agtacccgat tcacttccac ctggccggtg atgtagacga aaggggaggt tatgacccac 1980

ccacatacat cagggacctc tccatccatc atacattctc tcgctgcgtc acagtccatg 2040

gctccaatgg cttgttgatc aaggacgttg tgggctataa ctctttgggc cactgcttct 2100

tcacggaaga tgggccggag gaacgcaaca cttttgacca ctgtcttggc ctccttgtca 2160

agtctggaac cctcctcccc tcggaccgtg acagcaagat gtgcaagatg atcacagagg 2220

actcctaccc ggggtacatc cccaagccca ggcaagactg caatgctgtg tccaccttct 2280

ggatggccaa tcccaacaac aacctcatca actgtgccgc tgcaggatct gaggaaactg 2340

gattttggtt tatttttcac cacgtaccaa cgggcccctc cgtgggaatg tactccccag 2400

gttattcaga gcacattcca ctgggaaaat tctataacaa ccgagcacat tccaactacc 2460

gggctggcat gatcatagac aacggagtca aaaccaccga ggcctctgcc aaggacaagc 2520

ggccgttcct ctcaatcatc tctgccagat acagccctca ccaggacgcc gacccgctga 2580

agccccggga gccggccatc atcagacact tcattgccta caagaaccag gaccacgggg 2640

cctggctgcg cggcggggat gtgtggctgg acagctgccg gtttgctgac aatggcattg 2700

gcctgaccct ggccagtggt ggaaccttcc cgtatgacga cggctccaag caagagataa 2760

agaacagctt gtttgttggc gagagtggca acgtggggac ggaaatgatg gacaatagga 2820

tctggggccc tggcggcttg gaccatagcg gaaggaccct ccctataggc cagaattttc 2880

caattagagg aattcagtta tatgatggcc ccatcaacat ccaaaactgc actttccgaa 2940

agtttgtggc cctggagggc cggcacacca gcgccctggc cttccgcctg aataatgcct 3000

ggcagagctg cccccataac aacgtgaccg gcattgcctt tgaggacgtt ccgattactt 3060

ccagagtgtt cttcggagag cctgggccct ggttcaacca gctggacatg gatggggata 3120

agacatctgt gttccatgac gtcgacggct ccgtgtccga gtaccctggc tcctacctca 3180

cgaagaatga caactggctg gtccggcacc cagactgcat caatgttccc gactggagag 3240

gggccatttg cagtgggtgc tatgcacaga tgtacattca agcctacaag accagtaacc 3300

tgcgaatgaa gatcatcaag aatgacttcc ccagccaccc tctttacctg gagggggcgc 3360

tcaccaggag cacccattac cagcaatacc aaccggttgt caccctgcag aagggctaca 3420

ccatccactg ggaccagacg gcccccgccg aactcgccat ctggctcatc aacttcaaca 3480

agggcgactg gatccgagtg gggctctgct acccgcgagg caccacattc tccatcctct 3540

cggatgttca caatcgcctg ctgaagcaaa cgtccaagac gggcgtcttc gtgaggacct 3600

tgcagatgga caaagtggag cagagctacc ctggcaggag ccactactac tgggacgagg 3660

actcagggct gttgttcctg aagctgaaag ctcagaacga gagagagaag tttgctttct 3720

gctccatgaa aggctgtgag aggataaaga ttaaagctct gattccaaag aacgcaggcg 3780

tcagtgactg cacagccaca gcttacccca agttcaccga gagggctgtc gtagacgtgc 3840

cgatgcccaa gaagctcttt ggttctcagc tgaaaacaaa ggaccatttc ttggaggtga 3900

agatggagag ttccaagcag cacttcttcc acctctggaa cgacttcgct tacattgaag 3960

tggatgggaa gaagtacccc agttcggagg atggcatcca ggtggtggtg attgacggga 4020

accaagggcg cgtggtgagc cacacgagct tcaggaactc cattctgcaa ggcataccat 4080

ggcagctttt caactatgtg gcgaccatcc ctgacaattc catagtgctt atggcatcaa 4140

agggaagata cgtctccaga ggcccatgga ccagagtgct ggaaaagctt ggggcagaca 4200

ggggtctcaa gttgaaagag caaatggcat tcgttggctt caaaggcagc ttccggccca 4260

tctgggtgac actggacact gaggatcaca aagccaaaat cttccaagtt gtgcccatcc 4320

ctgtggtgaa gaagaagaag ttgtgaggac agctgccgcc cggtgccacc tcgtggtaga 4380

ctatgacggt gactcttggc agcagaccag tgggggatgg ctgggtcccc cagcccctgc 4440

cagcagctgc ctgggaaggc cgtgtttcag ccctgatggg ccaagggaag gctatcagag 4500

accctggtgc tgccacctgc ccctactcaa gtgtctacct ggagcccctg gggcggtgct 4560

ggccaatgct ggaaacattc actttcctgc agcctcttgg gtgcttctct cctatctgtg 4620

cctcttcagt gggggtttgg ggaccatatc aggagacctg ggttgtgctg acagcaaaga 4680

tccactttgg caggagccct gacccagcta ggaggtagtc tggagggctg gtcattcaca 4740

gatccccatg gtcttcagca gacaagtgag ggtggtaaat gtaggagaaa gagccttggc 4800

cttaaggaaa tctttactcc tgtaagcaag agccaacctc acaggattag gagctggggt 4860

agaactggct atccttgggg aagaggcaag ccctgcctct ggccgtgtcc acctttcagg 4920

agactttgag tggcaggttt ggacttggac tagatgactc tcaaaggccc ttttagttct 4980

gagattccag aaatctgctg catttcacat ggtacctgga acccaacagt tcatggatat 5040

ccactgatat ccatgatgct gggtgcccca gcgcacacgg gatggagagg tgagaactaa 5100

tgcctagctt gaggggtctg cagtccagta gggcaggcag tcaggtccat gtgcactgca 5160

atgccaggtg gagaaatcac agagaggtaa aatggaggcc agtgccattt cagaggggag 5220

gctcaggaag gcttcttgct tacaggaatg aaggctgggg gcattttgct ggggggagat 5280

gaggcagcct ctggaatggc tcagggattc agccctccct gccgctgcct gctgaagctg 5340

gtgactacgg ggtcgccctt tgctcacgtc tctctggccc actcatgatg gagaagtgtg 5400

gtcagagggg agcaatgggc tttgctgctt atgagcacag aggaattcag tccccaggca 5460

gccctgcctc tgactccaag agggtgaagt ccacagaagt gagctcctgc cttagggcct 5520

catttgctct tcatccaggg aactgagcac agggggcctc caggagaccc tagatgtgct 5580

cgtactccct cggcctggga tttcagagct ggaaatatag aaaatatcta gcccaaagcc 5640

ttcattttaa cagatgggga aagtgagccc ccaagatggg aaagaaccac acagctaagg 5700

gagggcctgg ggagccccac cctagccctt gctgccacac cacattgcct caacaaccgg 5760

ccccagagtg cccaggcact cctgaggtag cttctggaaa tggggacaag tcccctcgaa 5820

ggaaaggaaa tgactagagt agaatgacag ctagcagatc tcttccctcc tgctcccagc 5880

gcacacaaac ccgccctccc cttggtgttg gcggtccctg tggccttcac tttgttcact 5940

acctgtcagc ccagcctggg tgcacagtag ctgcaactcc ccattggtgc tacctggctc 6000

tcctgtctct gcagctctac aggtgaggcc cagcagaggg agtagggctc gccatgtttc 6060

tggtgagcca atttggctga tcttgggtgt ctgaacagct attgggtcca ccccagtccc 6120

tttcagctgc tgcttaatgc cctgctctct ccctggccca ccttatagag agcccaaaga 6180

gctcctgtaa gagggagaac tctatctgtg gtttataatc ttgcacgagg caccagagtc 6240

tccctgggtc ttgtgatgaa ctacatttat cccctttcct gccccaacca caaactcttt 6300

ccttcaaaga gggcctgcct ggctccctcc acccaactgc acccatgaga ctcggtccaa 6360

gagtccattc cccaggtggg agccaactgt cagggaggtc tttcccacca aacatctttc 6420

agctgctggg aggtgaccat agggctctgc ttttaaagat atggctgctt caaaggccag 6480

agtcacagga aggacttctt ccagggagat tagtggtgat ggagaggaga gttaaaatga 6540

cctcatgtcc ttcttgtcca cggttttgtt gagttttcac tcttctaatg caagggtctc 6600

acactgtgaa ccacttagga tgtgatcact ttcaggtggc caggaatgtt gaatgtcttt 6660

ggctcagttc atttaaaaaa gatatctatt tgaaagttct cagagttgta catatgtttc 6720

acagtacagg atctgtacat aaaagtttct ttcctaaacc attcaccaag agccaatatc 6780

taggcatttt cttggtagca caaattttct tattgcttag aaaattgtcc tccttgttat 6840

ttctgtttgt aagacttaag tgagttaggt ctttaaggaa agcaacgctc ctctgaaatg 6900

cttgtctttt ttctgttgcc gaaatagctg gtcctttttc gggagttaga tgtatagagt 6960

gtttgtatgt aaacatttct tgtaggcatc accatgaaca aagatatatt ttctatttat 7020

ttattatatg tgcacttcaa gaagtcactg tcagagaaat aaagaattgt cttaaatgtc 7080

<210> 89

<211> 1515

<212> DNA

<213> 智人

<400> 89

ggctcgggag agaccttgga gcgcgcggga aagagaccaa tataaactgt ggcgggatag 60

ttttcgggtc cttgtccagt gaaacaccct cggctgggaa gtcagttcgt tctctcctct 120

cctctcttct tgtttgaaca tggtgcggac taaagcagac agtgttccag gcacttacag 180

aaaagtggtg gctgctcgag cccccagaaa ggtgcttggt tcttccacct ctgccactaa 240

ttcgacatca gtttcatcga ggaaagctga aaataaatat gcaggaggga accccgtttg 300

cgtgcgccca actcccaagt ggcaaaaagg aattggagaa ttctttaggt tgtcccctaa 360

agattctgaa aaagagaatc agattcctga agaggcagga agcagtggct taggaaaagc 420

aaagagaaaa gcatgtcctt tgcaacctga tcacacaaat gatgaaaaag aatagaactt 480

tctcattcat ctttgaataa cgtctccttg tttaccctgg tattctagaa tgtaaattta 540

cataaatgtg tttgttccaa ttagctttgt tgaacaggca tttaattaaa aaatttaggt 600

ttaaatttag atgttcaaaa gtagttgtga aatttgagaa tttgtaagac taattatggt 660

aacttagctt agtattcaat ataatgcatt gtttggtttc ttttaccaaa ttaagtgtct 720

agttcttgct aaaatcaagt cattgcattg tgttctaatt acaagtatgt tgtatttgag 780

atttgcttag attgttgtac tgctgccatt tttattggtg tttgattatt ggaatggtgc 840

catattgtca ctccttctac ttgctttaaa aagcagagtt agatttttgc acattaaaaa 900

attcagtatt aattaaacat tacttattct accctctttt ttggcaagga ggacaaatac 960

gcaatgttgg aaaaccttgg atggatatct tctctttaaa aaaatgtaaa gataatttgg 1020

tcttgagggt ttaaacggtt gataatgcct ctacaacaac aagaaaaaag ataaaatact 1080

aggatagaat catggtgggc acagtggctt ctcaggaggc tgaggaggga ggtttgcttg 1140

agtccaggag ttggagacca gcccaggcaa catagcgtaa accctatctc taaaacaatt 1200

tttagccggg tgcggtggct cacgcctgta atcccagcac tctgggaggc cgaggcgggt 1260

ggatcatgag gtcaggagat cgagaccatc ctgcctaaca aggtgaaacc ccgtctctac 1320

taaaaataca aaaaattagc cgggcgcggt ggcgggcgcc tgtagtccca gctactcggg 1380

aggctgaggc aggagaatgg cgtgaacccg ggaagtggag cttgcagtga gccgagattg 1440

cgccactgca gtcggcagtc cggcttgggc gacagagcga gactccgtct caaaaaaaaa 1500

aaaaaaaaaa aaaaa1515

<210> 90

<211> 1774

<212> DNA

<213> 智人

<400> 90

agtactgaaa ttaagcagca tccaacacag gcctactctt acgacatgtg actttactgt 60

tttccgtttt tgttgaaaga gtcattaaca gttaggagtt gatggcagtt tcaataacag 120

gtcattgccg agaaaaggat agcactataa tatgcagaaa tctacaaatt ctgatacttc 180

cgtggaaaca ctgaattcta cccgccaagg cacaggagct gtgcaaatga gaatcaaaaa 240

tgccaacagc caccatgaca ggctcagcca aagtaaatcc atgatcctca ccgatgtcgg 300

gaaggtcact gaacctatat ccagacacag aaggaatcat tcacagcata tcttgaaaga 360

tgtcattcct ccattggaac aactgatggt tgaaaaagaa ggttatctgc aaaaagctaa 420

aattgcagat ggaggaaaga aactaaggaa aaactggtct acttcctgga ttgttctttc 480

tagtcgaaga attgaatttt acaaagaatc caagcaacag gctctgtcca atatgaaaac 540

tgggcacaaa ccagaaagtg tggatttgtg tggagcacac attgaatggg ccaaggaaaa 600

atcgagcaga aagaatgtct ttcagatcac aacagtatca ggaaatgagt tccttctaca 660

gtcagatatt gacttcatca tattggattg gttccacgct atcaaaaatg caattgacag 720

attgccaaag gattcaagtt gtccatcaag aaacctggaa ttattcaaaa tccaaagatc 780

ctctagcact gaattgctaa gtcactacga cagtgatata aaagaacaga aaccagagca 840

cagaaaatct ttaatgttca gactgcatca cagtgcttcc gatacaagcg acaaaaatcg 900

agttaaaagc agattaaaga agtttattac ccgaagacct tccctgaaaa ctctgcaaga 960

aaaaggactt attaaagatc aaatttttgg ctctcatctg cacaaagtgt gtgaacgtga 1020

aaattccaca gttccgtggt ttgtaaagca atgcattgaa gctgttgaga aaagaggtct 1080

agatgttgat ggaatatatc gagttagtgg caatctggca acaatacaga agttaagatt 1140

tattgtcaac caagaagaga agctgaattt ggacgacagc cagtgggagg acatccacgt 1200

tgtcaccgga gcactgaaga tgtttttccg ggagctgcct gagccgctct tcccttacag 1260

tttctttgag cagtttgtgg aagcgatcaa aaagcaagac aacaacacaa gaattgaagc 1320

tgtaaaatct cttgtacaaa aactccctcc gccaaatcgt gacaccatga aagtcctctt 1380

tggacatcta actaagatag tggccaaagc ctccaagaac ctcatgtcca cgcaaagctt 1440

ggggattgta tttggaccta cccttctgcg agctgaaaat gaaacaggaa acatggcgat 1500

ccacatggtc taccagaacc agatagctga gctcatgctg agtgagtaca gtaagatctt 1560

cggctcagag gaagactgac agacaagaca agctactgaa tacgttcaca tctgtcttga 1620

tgcctaatat ttttacattt ctgtaaacat atttctgaaa tattttttgc ctttcaagcg 1680

acagatgcct cattttgtga aaacttaatg atgattttgt gtttaagttc caaacatttg 1740

aataaaataa ttgacaataa aaaaaaaaaa aaaa 1774

<210> 91

<211> 2707

<212> DNA

<213> 智人

<400> 91

gtatgctgct gctgccgggt gtccatggcc cgcaccccca agctgccact gcagcagtca 60

gagtggcagc tgaaggctcg gttcatgccg tgcccccggg cagttctggt gaggctaagc 120

aagaggcctc tgcatcttga cacctaggag agcagggacg gagtctccca gggtggagga 180

ccatgctgcg ccgcaagccc tccaatgcca gtgagaagga gcccactcag aagaaaaagc 240

tctcccttca gcgctccagc agcttcaagg attttgccaa atccaaaccc agctcccccg 300

tggtgagcga gaaggagttt aatctggatg ataacattcc agaagatgac tcaggtgtcc 360

ccaccccaga agatgctggg aagagtggca aaaagctggg gaagaagtgg agggcagtga 420

tttcccgaac catgaacagg aagatgggca agatgatggt gaaggccctg tcagaagaga 480

tggcagacac tctggaggag ggctctgcct ccccgacatc tccagactac agcctggaca 540

gccctggccc tgagaagatg gcgctggcct tttctgagca agaggagcat gaacttccgg 600

tgctcagccg ccaggcatca acaggcagtg agctctgcag ccccagccca ggttctggca 660

gcttcgggga ggaaccacct gccccccagt acacagggcc tttctgtggc cgggcacgag 720

tccacaccga cttcactccc agcccctatg accacgactc gctgaaactg cagaaaggag 780

atgtgatcca gatcattgaa aagccacctg tgggcacgtg gctgggccta ctcaatggca 840

aggtgggctc tttcaaattc atctatgtgg atgtgctgcc cgaggaggcc gtggggcatg 900

cccgccccag ccgccgacag agcaagggca agaggcccaa gcctaagacc ctgcatgagc 960

tgctggagcg catcggcctg gaggagcaca catccaccct cctgctcaat ggctaccaga 1020

cactggaaga cttcaaagag ctgcgagaaa cacacctcaa tgagctgaac atcatggatc 1080

cacagcaccg ggccaagctg ctcacggccg ccgagctgct gctggactat gacactggca 1140

gtgaggaggc tgaagagggc gccgagagca gccaggagcc agtggcacac acagtgtcgg 1200

aacccaaggt ggacatcccg cgcgactcag gctgctttga gggctcggag agcgggcgcg 1260

atgacgcaga gctggcaggc actgaggagc agctgcaagg cctctccctg gccggggcac 1320

cttgaggtgg cggtggcaat aggccaaggc tgggacccag ctgcaaaggc tgtaggagtg 1380

ggcccagcct cccgtggtgg cccaggtcct gaggactggc actgagcctg gccctgcttc 1440

cccagggaca cttagggcca cagaggccag gccagggccc tacaggttcc aggctcagct 1500

ggagtggttg gggagtcgcc caagggcaca tcccacctgc ctgagccccg ccctccacca 1560

gcgactgaca gcgcagcccc tcctggcacc aactgctccc ctgccatggc cacggccaca 1620

gcaagtgggg cactgggaaa ccctgcccat gtccctcacc aacaaggcct ccaaatcctc 1680

ctcaccccca caccacctac ccctgtcgca ctgctcctga aaagggggcc aagtcaatgt 1740

ttcaggtcag tctaaaaacc ctagggaagc tggccattta aaagaaccca aactgaccat 1800

gggtaaatcc agttccccta aataaggcct gaagaaatcc acaggtacca ttcccacttt 1860

ccttctccct agctttctta gaggtttggc cactaaatct tatgagactt gaaccaagtg 1920

gcttcctctt tctaggctta ggacgggttg gggttagaaa gggtgatcac tgaaggcctt 1980

gcctgctctg acattctgtg acattaaatg tctattctcc tgttacctgt ggcctgggac 2040

accagtgggg tttatcgagg ggaccagagg ggcctcaggc tttcagatga aatggctcct 2100

cctactcacc cactttattc ctctccatgt aattcaggac aagctgcaac ttcccccagc 2160

ttaacacaat gcccatacct catacgatat gcgccctccc gttccatccc tggccccctc 2220

aaacgagact tctcacaagg ctgattacag atggtcaaac ctggcttcca aggacagaat 2280

tgcctctcgg aagccagctg tggatctgag tccagagttg gccacttgtg tgggtcctca 2340

caagcaaaga gagcactaaa cttgacattg ggggtccacc actccaactt tgctttctga 2400

aggttttggt gtacattgag ccccagaagg aaaggagagt atctgtgagt gggggcctcc 2460

cttgacccca gtacgaagtc tatgccctga atccccagag tagcccttcc tggtgcccaa 2520

ctggcctggg gacaaacagc gtccactaca tctaggactg ccggctaagt ggacacactt 2580

cttgacctcc taccaggaac tttggtaaaa gctagctttg gggaaggggt tgggtgtaaa 2640

tatgagaggg tggagggaga ccagctggta gcaataaaca tgggtagaac taaaaaaaaa 2700

aaaaaaa 2707

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号