公开/公告号CN106460047A
专利类型发明专利
公开/公告日2017-02-22
原文格式PDF
申请/专利权人 比奥马卡尔技术有限公司;
申请/专利号CN201580021875.2
申请日2015-04-02
分类号C12Q1/68(20060101);
代理机构11262 北京安信方达知识产权代理有限公司;
代理人王玮玮;郑霞
地址 以色列耶路撒冷
入库时间 2023-06-19 01:41:15
法律状态公告日
法律状态信息
法律状态
2022-03-15
未缴年费专利权终止 IPC(主分类):C12Q 1/6886 专利号:ZL2015800218752 申请日:20150402 授权公告日:20191126
专利权的终止
2019-11-26
授权
授权
2017-04-05
实质审查的生效 IPC(主分类):C12Q1/68 申请日:20150402
实质审查的生效
2017-02-22
公开
公开
发明领域
本发明涉及根据一些实施方案用于基于特定mRNA生物标志的一种或更多种表达谱鉴定患有癌前进展期(advanced)息肉或结肠直肠癌的受试者的方法及试剂盒。本发明还包括用于结肠直肠癌的诊断、预防、疗法管理、监测和倾向鉴定的方法及试剂盒。
发明背景
结肠直肠癌(CRC)是最常见的癌症之一,占所有癌症病例的约10%和所有癌症死亡的约8%。实体癌通常基于组织病理学组织评价来诊断,其中用于CRC的金标准为光纤结肠镜检查。这种技术是劳动密集型的、耗时的、昂贵的且极具侵入性的。已知,替代方案粪便潜血测试(fecal occult blood test;FOBT)尽管不是侵入性的,却受低灵敏度困扰。
筛查和监测测定对癌症的早期检测和管理至关重要。基于血液的测试能够大规模筛查临床上无症状(据推测为健康)的个体,以用于癌症的诊断、监测及预测。此外,基于血液的取样是普遍且方便的,并因此,可增加无症状群体中的依从性。
Bonilla等(Oncology Letters,2,719-714,2011)公开了与罹患进展期结肠直肠癌的患者中的不良预后相关的mRNA生物标志。
可与结肠直肠癌相关的数百个基因的综合列表被公开在例如Ye等,Plos one,2013;8(5),e62870;以及Garcia等,Clinical Chem.53(10):1860-1863,2007中。Marshall等(Int J Cancer 2010;126:1177-1186)公开了基于从外周血细胞提取的RNA的用于CRC的生物标志,其对应于以下七个基因的组:ANXA3、CLEC4D、LMNB1、PRRG4、TNFAIP6、VNN1和IL2RB。
US 2010/0330079公开了一种用于检测用于早期诊断和管理结肠直肠癌的蛋白生物标志的方法。该方法包括获得关于外周血中51个基因的表达的定量信息。
WO 2011/012136公开了一种用于基于一组miRNA的表达水平区分CRC样品与非癌性样品的方法。
对以改进的灵敏度和特异度用于早期检测和治疗癌前进展期息肉和结肠直肠癌的具成本效益、快速、准确和微创性(minimally invasive)的方法及试剂盒存在未满足的需求。
发明概述
本发明提供了用于鉴定受试者中的结肠癌和癌前息肉的方法及试剂盒。有利地,本发明的方法及试剂盒基于非侵入性的基于分子的分析(anon-invasive molecularbased analysis)区分具有癌前进展期息肉的结肠与结肠直肠癌。此外,本发明的方法及试剂盒提供了具有高灵敏度(至少60%)和高特异度(高于85%)的诊断平台。
本发明的前提是基于以下发现:早在明显的疾病(overt disease)外显之前,疾病相关的生物标志可在血浆或其他体液中被鉴定出。由本发明的生物标志所赋予的另一个优势来自以下事实:生物标志是细胞外的,从而起源于所有身体组织。此外,这些生物标志不受免疫应答影响。本文提供了来自罹患结肠直肠癌的患者的血浆足迹(footprint)的这些生物标志的存在或不存在作为早期诊断工具,对于其,治疗策略可被设计并施用以预防、延迟或逆转赘生性结肠直肠细胞的形成。本发明的数种疾病相关的生物标志的一种或组合对诊断罹患癌前进展期息肉或结肠直肠癌的受试者是有用的,或者有利地,对诊断对于结肠直肠癌为无症状的那些受试者是有用的。
出人意料地,如本文显示的,本发明的方法使用有限数目的核酸序列生物标志的表达谱来鉴定健康的受试者、患有结肠直肠癌的受试者及患有癌前进展期息肉的受试者。此外,本发明的生物标志在远离疾病部位的血浆样本中被鉴定出。出人意料地,基于所述血浆的生物标志提供差异表达的基因谱,该基因谱以高特异度和高灵敏度与病理检查报告相关。
根据一些实施方案,提供了一种用于鉴定患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者的方法,所述方法包括:
(a)提供来自受试者的生物样品;
(b)测量所述生物样品中包含SEQ ID NO:1中列出的核酸序列的生物标志的表达水平;以及
(c)鉴定所述生物标志的表达水平高于所述生物标志的截断值(cutoff value),从而将所述受试者鉴定为患有结肠直肠癌或癌前进展期结肠直肠息肉。
根据一些实施方案,所述生物标志包含SEQ ID NO:1且还包含选自SEQ ID NO:2、3、5-7、12和17的至少一种核酸序列。每种可能性是本发明的单独的实施方案。
根据一些实施方案,所述生物标志包含SEQ ID NO:1-3、5-7、12和17中列出的核酸序列且所述受试者被鉴定为患有结肠直肠癌。
根据一些实施方案,所述生物标志由SEQ ID NO:1-3、5-7、12和17中列出的核酸序列组成。
根据一些实施方案,所述生物标志还包含SEQ ID NO:1和5中列出的核酸序列,且所述受试者被鉴定为患有癌前进展期结肠直肠息肉。
根据一些实施方案,所述生物标志由SEQ ID NO:1和5中列出的核酸序列组成。
根据一些实施方案,所述生物标志包含SEQ ID NO:1且还包含选自SEQ ID NO:3、4、6和14的至少一种核酸序列。每种可能性是本发明的单独的实施方案。
根据一些实施方案,所述生物标志包含SEQ ID NO:1和4以及选自SEQ ID NO:3、6和14的至少一种核酸序列。每种可能性是本发明的单独的实施方案。
根据一些实施方案,所述生物标志包含SEQ ID NO:1、3和4。
根据一些实施方案,所述生物标志包含SEQ ID NO:1、4、6和14。
根据一些实施方案,所述生物标志包含SEQ ID NO:1、3、4和14。
根据一些实施方案,所述生物样品选自由以下组成的组:血液、血浆、唾液、血清或其组合。每种可能性是本发明的单独的实施方案。
根据一些实施方案,所述生物样品为从外周血提取的血浆。
根据一些实施方案,生物标志为循环mRNA。
根据一些实施方案,测量所述生物标志的表达包括选自以下的至少一种核酸分析技术:聚合酶链式反应(PCR)、定量PCR、核酸测序技术、限制性酶切消化、特异性杂交、单链构象多态性测定(SSCP)及电泳分析。每种可能性是本发明的单独的实施方案。
根据一些实施方案,测量所述生物标志的表达包括:从血浆提取mRNA、将所述mRNA逆转录为cDNA以及使用定量PCR测量所述cDNA的表达水平。
根据一些实施方案,提供了一种用于鉴定患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者的方法,所述方法包括:
(a)提供来自受试者的生物样品;
(b)测量所述生物样品中包含SEQ ID NO:2中列出的核酸序列的生物标志的表达水平;以及
(c)鉴定所述生物标志的表达水平高于所述生物标志的截断值,从而将所述受试者鉴定为患有结肠直肠癌或癌前进展期结肠直肠息肉。
根据一些实施方案,所述生物标志包含SEQ ID NO:2且还包含选自SEQ ID NO:1、3、5-7、12和17的至少一种核酸序列。每种可能性是本发明的单独的实施方案。
根据一些实施方案,提供了一种用于鉴定患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者的方法,所述方法包括:
(a)提供来自受试者的生物样品;
(b)测量所述生物样品中包含多种核酸序列的生物标志的表达水平,所述多种包括SEQ ID NO:1及选自SEQ ID NO:2、3、5-7、12和17的至少一种核酸序列;以及
(c)鉴定所述生物标志的表达水平高于所述生物标志的截断值,从而将所述受试者鉴定为患有结肠直肠癌或癌前进展期结肠直肠息肉。
根据一些实施方案,提供了一种用于鉴定患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者的方法,所述方法包括:
(a)提供来自受试者的生物样品;
(b)测量包含多种核酸序列的生物标志的表达水平,所述多种包括SEQ ID NO:6、9和14;以及
(c)鉴定所述生物标志的表达水平高于所述生物标志的截断值,从而将所述受试者鉴定为患有结肠直肠癌或癌前进展期结肠直肠息肉。
根据一些实施方案,方法还包括提供所述生物标志的截断值。根据一些实施方案,方法还包括提供对应于生物标志的每种核酸序列的截断值。根据一些实施方案,方法还包括提供对应于生物标志的多种核酸序列的截断值。
根据一些实施方案,方法还包括治疗患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者。
根据一些实施方案,治疗包括以下的至少一种:施用化疗剂、进行肠切除、应用放射疗法及其组合。每种可能性是本发明的单独的实施方案。
根据一些实施方案,化疗剂选自由以下组成的组:5-氟尿嘧啶、亚叶酸、奥沙利铂、卡培他滨及其组合。每种可能性是本发明的单独的实施方案。
根据一些实施方案,提供了一种用于鉴定患有结肠直肠癌的受试者的试剂盒,所述试剂盒包括:(a)用于测量从受试者获得的生物样品中生物标志的表达水平的工具,所述生物标志包含选自由SEQ ID NO:1至17组成的组的至少一种核酸序列;以及(b)用于确定所述至少一种生物标志的截断值或关于所述至少一种生物标志的截断值的信息的工具,其中至少一种生物标志的表达水平高于所述截断值将所述受试者鉴定为患有结肠直肠癌。
根据一些实施方案,用于测量所述生物标志的表达水平的工具为能够扩增选自由SEQ ID NO:1至17组成的组的至少一种核酸序列的至少一种寡核苷酸、能够与所述至少一种核酸序列杂交的至少一种寡核苷酸、位于所述至少一种核酸序列侧翼的核苷酸引物对及其组合。
根据一些实施方案,能够与所述至少一种核酸序列杂交的至少一种寡核苷酸包含可检测的标记物。
根据一些实施方案,可检测的标记物产生与所述至少一种生物标志的表达水平相关的信号。
根据一些实施方案,可检测的标记物产生光学信号。
根据一些实施方案,所述工具为位于至少一种核酸序列侧翼的核苷酸引物对,且核苷酸引物对包含可检测的标记物。
根据一些实施方案,试剂盒还包括其用于鉴定患有结肠直肠癌的受试者的使用说明书。
本发明的另外的实施方案、特征、优势和适用性的完全范围将从下文提供的详述和附图变得明显。然而,应该理解,尽管指出了本发明的优选实施方案,详述仅通过示例的方式提供,因为根据该详述,在本发明的精神和范围内的多种改变和修改将对本领域技术人员变得明显。
附图简述
图1示出了下文实施例中描述的实验程序的实施方案。
图2描绘了用于管家基因HPRT1(A)和TFRC(B)的每一个的引物的浓度校准曲线。
图3描绘了对于以下6种不同的生物标志,患有结肠直肠癌(癌症)的受试者、患有癌前进展期息肉(进展期息肉)的受试者的真阳性百分比(灵敏度)和健康(正常)亚群的假阳性百分比(一(1)减去特异度)的饼形图:BAD(A;SEQ ID NO:2)、BAMBI(B;SEQ ID NO:3)、NEK6(C;SEQ ID NO:5)、FKBP5(D;SEQ ID NO:7)、EPAS1(E;SEQ ID NO:6)及CHD2(F;SEQ IDNO:1)。
图4展示了两种生物标志组合的归一化的表达水平(每个柱指单个受试者):在健康(正常-纹理灰色)的受试者、患有癌前进展期息肉(癌前-实体灰色)的受试者及患有结肠直肠癌(癌症-实体黑色)的受试者中的(A)COX11、KIAA1199和BAD;且(B)CHD2和EPAS1。
图5为生物标志BAD;BAMBI;CHD2;FKBP5;SASH3;NEK6;EPAS1和KLF9(分别为SEQ IDNO:2、3、1、7、17、5、6和12)的最大值的ROC分析,且在健康(对照)和癌症(CA)中的聚簇模型(cluster-model)的AUC产生75%的灵敏度和93%的特异度。
图6示出了对应于图5的标志的聚簇模型健康(对照)和癌症(CA)的样品分布,其中虚线指示高于85%的特异度和最大约登指数点(Youden index point)(0.84)。
图7为生物标志BAD和NEK6的最大值的ROC分析,且在健康(对照)和癌前(AD)中的聚簇模型的AUC产生60%的灵敏度和87%的特异度。
图8示出了对应于图7的标志的聚簇模型健康(对照)和癌前(AD)的样品分布,其中虚线指示高于85%的特异度和最大约登指数点(2)。
发明详述
本发明提供了应用于鉴定癌前进展期息肉和结肠直肠癌的生物标志及其组合。
因此,本发明涉及用于分析牵涉癌前进展期息肉和结肠直肠癌的血浆生物标志的生物标志和生物标志组合及方法。本发明的生物标志包括对应于SEQ ID NO:75-91中列出的17个基因或其片段,包括SEQ ID NO:1-17中列出的基因片段的一个或更多个mRNA区段。
本发明的公开的方法、试剂盒、生物标志及生物标志组合被设计为筛查并鉴定结肠直肠癌,优选地具有等于或高于60%的灵敏度和等于或高于85%的特异度。
通常,本发明的方法对获得涉及血液样品中的癌前进展期息肉和结肠直肠癌的诊断包括早期诊断的生物标志谱和关于许多不同基因的表达的定量信息是有用的。
生物标志的水平可经电泳或免疫化学测量,其中免疫化学检测可通过放射免疫测定、免疫荧光测定或通过酶联免疫吸附测定来实现。在一些实施方案中,生物标志的水平通过qPCR测量。
用于CRC的目前的分子诊断学尚不足够灵敏以区分癌前进展期息肉与结肠直肠癌。约60%的患者首次就被诊断为患有进展期疾病。因此,在美国,在CRC患者的治疗和管理方面每年花费约$14B。
因此,本文提供的诊断平台克服了目前的CRC诊断的缺陷,所述诊断平台提供高特异度和高灵敏度、以及低成本和改进的患者依从性。
根据一些实施方案,提供了一种用于鉴定患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者的方法,所述方法包括:
(a)提供来自受试者的生物样品;
(b)测量所述生物样品中包含SEQ ID NO:1中列出的核酸序列的生物标志的表达水平;以及
(c)鉴定所述生物标志的表达水平高于所述生物标志的截断值,从而将所述受试者鉴定为患有结肠直肠癌或癌前进展期结肠直肠息肉。
根据一些实施方案,提供了一种用于鉴定患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者的方法,所述方法包括:
(a)提供来自受试者的生物样品;
(b)测量所述生物样品中包含SEQ ID NO:2中列出的核酸序列的生物标志的表达水平;以及
(c)鉴定所述生物标志的表达水平高于所述生物标志的截断值,从而将所述受试者鉴定为患有结肠直肠癌或癌前进展期结肠直肠息肉。
根据一些实施方案,生物标志包含SEQ ID NO:3中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:4中列出的核酸序列。根据一些实施方案,生物标志包含SEQID NO:5中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:6中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:7中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:8中列出的核酸序列。根据一些实施方案,生物标志包含SEQID NO:9中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:10中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:11中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:12中列出的核酸序列。根据一些实施方案,生物标志包含SEQID NO:13中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:14中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:15中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:16中列出的核酸序列。根据一些实施方案,生物标志包含SEQ ID NO:17中列出的核酸序列。
根据一些实施方案,生物标志包含选自SEQ ID NO:1-17的多种核酸序列。根据一些实施方案,方法包括测量生物标志的表达水平,并确定选自SEQ ID NO:1-17的每种核酸序列的截断值,其中所述多种的至少一种核酸序列的表达水平高于截断值指示所述受试者为患有结肠直肠癌或癌前进展期结肠直肠息肉。
根据一些实施方案,所述生物标志包含SEQ ID NO:1中列出的核酸序列且还包含SEQ ID NO:2-3、5-7、12和17的至少一种,且所述受试者被鉴定为患有结肠直肠癌。
根据一些实施方案,所述生物标志包含SEQ ID NO:1-3、5-7、12和17中列出的核酸序列且所述受试者被鉴定为患有结肠直肠癌。
根据一些实施方案,所述生物标志由SEQ ID NO:1-3、5-7、12和17中列出的核酸序列组成。
根据一些实施方案,所述生物标志包含SEQ ID NO:1和SEQ ID NO:5。
根据一些实施方案,所述生物标志由SEQ ID NO:1和SEQ ID NO:5组成。
根据一些实施方案,所述生物标志包含SEQ ID NO:1和SEQ ID NO:3。根据一些实施方案,所述生物标志包含SEQ ID NO:1和SEQ ID NO:4。根据一些实施方案,所述生物标志包含SEQ ID NO:1和SEQ ID NO:6。根据一些实施方案,所述生物标志包含SEQ ID NO:1和SEQ ID NO:14。根据一些实施方案,所述生物标志包含SEQ ID NO:1、SEQ ID NO:3和SEQ IDNO:4。根据一些实施方案,所述生物标志包含SEQ ID NO:1、SEQ ID NO:3和SEQ ID NO:6。根据一些实施方案,所述生物标志包含SEQ ID NO:1、SEQ ID NO:3和SEQ ID NO:14。根据一些实施方案,所述生物标志包含SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:6和SEQ ID NO:14。根据一些实施方案,所述生物标志包含SEQ ID NO:1、SEQ ID NO:4和SEQ ID NO:6。根据一些实施方案,所述生物标志包含SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:6和SEQ ID NO:14。根据一些实施方案,所述生物标志包含SEQ ID NO:1、SEQ ID NO:6和SEQ ID NO:14。根据一些实施方案,所述生物标志包含SEQ ID NO:6和SEQ ID NO:9。根据一些实施方案,所述生物标志包含SEQ ID NO:6和SEQ ID NO:14。根据一些实施方案,所述生物标志包含SEQ ID NO:9和SEQ ID NO:14。根据一些实施方案中,所述生物标志包含SEQ ID NO:6、SEQ ID NO:9和SEQ ID NO:14。根据一些实施方案,所述生物标志由以上提及的组合的任何一个组成。
根据一些实施方案,本发明提供了一种用于鉴定患有癌前进展期结肠直肠息肉的受试者的方法,所述方法包括:获得来自受试者的生物样品;测量所述生物样品中包含选自由SEQ ID NO:1至17(表1B)中列出的组的至少一种核酸序列的生物标志的表达水平;以及确定所述至少一种核酸序列的表达水平高于其截断值,从而将受试者鉴定为患有癌前进展期结肠直肠息肉或结肠直肠癌。
根据一些实施方案,确定SEQ ID NO:1的表达水平低于SEQ ID NO:1的截断值、至少一种第一生物标志的表达水平低于所述至少一种第一生物标志的截断值且至少一种第二生物标志的表达水平高于所述至少一种第二生物标志的截断值,将受试者鉴定为患有癌前进展期结肠直肠息肉,其中所述第一生物标志为SEQ ID NO:3-8及10-13和15-17的任一种或更多种,且其中所述第二生物标志包含SEQ ID NO:2、9和14的至少一种。每种可能性是本发明的单独的实施方案。
根据一些实施方案,所述第二生物标志包含SEQ ID NO:2。根据一些实施方案,所述第二生物标志包含SEQ ID NO:9。根据一些实施方案,所述第二生物标志包含SEQ ID NO:14。根据一些实施方案,所述第二生物标志包含SEQ ID NO:2和9。根据一些实施方案,所述第二生物标志包含SEQ ID NO:2和14。根据一些实施方案,所述第二生物标志包含SEQ IDNO:9和14。
根据一些实施方案,如本文使用的术语“癌前进展期息肉”、“癌前”、“进展期腺瘤”、“AD”、“AA”及“息肉”是可互换的并指结肠直肠息肉、赘生性癌前病变或可能发展成恶性肿瘤或腺瘤性息肉的其他异常组织生长或病变。已显示癌前进展期息肉的检测降低了CRC的发生率和死亡率。事实上,约85%的CRC是散发性的并且由腺瘤发展而来。
根据一些实施方案,大于1cm的腺瘤或具有重度异生或绒毛状结构的腺瘤被称为“进展期腺瘤”,并且通常被认为是在筛查中检测的相关度最高的子集。估计由腺瘤发展为CRC需要5至10年。由于大多数CRC病例由癌前病变发展而来,筛查对患者具有显着的临床益处。
根据一些实施方案,“生物标志”包括但不限于以下的一种或更多种:具有特定生物学特性的分子指示物;可用来检测结肠直肠癌的生物化学特征或事实。通常,“生物标志”包括但不限于蛋白、核酸和代谢物,连同它们的多态性、突变、变体、修饰、亚基、片段、蛋白-配体复合物及降解产物、蛋白-配体复合物、元素、相关代谢物、电解质、元素及其他分析物或样品衍生的测量。生物标志还可包括突变的蛋白或突变的核酸。生物标志还可指健康状态的非分析物生理标志,其包括结肠直肠癌的其他临床特征或危险因素,诸如,但不限于年龄、种族及癌症家族史。
如本文使用的,术语“生物标志”指基因或其片段的核酸序列,其表达指示结肠癌或癌前进展期结肠直肠息肉。生物标志可以是代表基因或其片段的mRNA或与其对应的cDNA。生物标志包含SEQ ID NO:1-17的任一种或更多种。根据一些实施方案,生物标志包含SEQ ID NO:75-91的任一种或更多种或其片段,包括但不限于,SEQ ID NO:1-17的任一种或更多种。
根据一些实施方案,如本文使用的术语“核酸序列”和“多核苷酸”可互换使用,并且包括任何长度的脱氧核糖核苷酸或核糖核苷酸的核苷酸或其类似物的聚合形式。以下是多核苷酸的非限制性实例:基因或基因片段、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA),核糖体RNA(rRNA)、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针及引物。多核苷酸可包含修饰的核苷酸,诸如甲基化的核苷酸及核苷酸类似物。核苷酸序列可以被非核苷酸组分中断。在聚合之后,多核苷酸可诸如通过与标记组分缀合被进一步修饰。术语还包括双链分子和单链分子。
RNA为高度不稳定的、易于降解的,并因此在保护性细胞环境以外不太可能是稳定的或可检测的。然而,在正常状态中被高度调控的RNA表达在病理状态,诸如,癌症中变得愈发失调。因此,对RNA表达进行谱系分析对鉴定癌症类型和时期是有用的。
此外,出于以下的许多原因,使用来自血浆的循环RNA用于分析癌症是非常有吸引力的:
(a)取样要求微创性方法(minimally invasive method)(抽取少量的血液);
(b)可重复地且在肿瘤进展期间的任何时间获得取样,允许分析对治疗的响应;
(c)整体的简单性使其适合于在处于风险的无症状群体中使用;以及
(d)注意到结肠癌中的循环肿瘤细胞和循环肿瘤mRNA之间的相关性,并且发现乳腺癌患者的血浆中的mRNA比DNA更敏感。
根据一些实施方案,代表生物标志的核酸序列为循环mRNA。
根据一些实施方案,术语“循环”指在血流中发现的核酸区段。
根据一些实施方案,代表生物标志的核酸序列为对应于循环mRNA的cDNA。
如本文使用的,术语“cDNA”指互补DNA。根据一些实施方案,cDNA指分离的多核苷酸、核酸分子或其任何片段或互补物。根据一些实施方案,cDNA通过重组技术获得或经合成方法来合成,可以是双链的或单链的,代表编码序列和/或非编码的5'和3'序列。
根据一些实施方案,如本文使用的“分析物”指待测量且任选地用于鉴定患有某些疾病或紊乱的亚群的任何物质。换言之,生物标志(分析物)可以是被客观测量和评价的作为正常生物过程、致病过程或对治疗性干预的药理学响应的指标的特征。
根据一些实施方案,术语“结肠癌”指在结肠的组织(大肠的最长部分)中形成的癌症和/或赘生物。通常,结肠癌是腺癌(在产生和释放粘液及其他流体的细胞中引发的癌症)。
根据一些实施方案,术语“直肠癌”指在直肠的组织(在肛门之前的大肠的最后几英寸)中形成的癌症和/或赘生物。
根据一些实施方案,在本发明的上下文中的术语“结肠直肠癌”包括但不限于出现在结肠或直肠中的癌症。
本发明部分地基于以下意外发现:来自受试者的流体(血液)样品或任何排泄物中的不同生物标志及生物标志的不同的集(set)以高特异度和灵敏度鉴定受试者的癌性状态或癌前状态。因此,根据本发明的鉴定是准确并可靠的。此外,由于本发明的生物标志从流体样品(例如,血清、血浆或血液)或从排泄物(例如,粪便或尿液)获得,本发明的方法有利地为非侵入性的。
如本文使用的,术语“鉴定(identification)”、“将受试者鉴定(identifying)为”和“将受试者鉴定(identifies)为患有”是可互换的,并且包括以下的任一种或更多种:筛查结肠直肠癌;检测癌症的存在或癌症的严重程度;癌症的预后;癌症的早期诊断;诊断癌前进展期息肉;癌症的疗效和/或复发;以及用于选择癌症疗法和/或治疗的平台,优化给定的癌症疗法和/或预测疗法对于特定受试者(例如,患者)或亚群的适合性或确定治疗性产品在患者或亚群中的适当的给药。每种可能性是本发明的单独的实施方案。
根据一些实施方案,受试者为人受试者。
根据一些实施方案,从受试者获得的样品为体液或排泄样品,包括但不限于精浆(seminal plasma),血液,外周血,血清,尿液,前列腺液,精液(seminal fluid),精液(semen),皮肤、呼吸道、肠道和泌尿生殖道的外分泌物,泪液,脑脊液,痰,唾液,乳汁,腹膜液,胸膜液,腹膜液,囊液,体腔灌洗液,支气管肺泡灌洗液,生殖系统灌洗液和/或身体的任何其他器官或体内系统的灌洗液及粪便。每种可能性是本发明的单独的实施方案。
根据一些实施方案,获得包含组织或流体的生物样品通过以下收集方法中的任一种或更多种来进行:血液取样、尿液取样、粪便取样、痰取样、胸膜液或腹膜液的抽吸、细针穿刺活检、针穿刺活检、芯针穿刺活检和手术活检以及灌洗液。每种可能性是本发明的单独的实施方案。无论采用何种程序,在获得活检物/样品之后,可确定生物标志的水平,并因此可做出诊断。
根据一些实施方案,从受试者获得的样品为外周血。
根据一些实施方案,如本文使用的术语“外周血”指包含红细胞、白细胞及血小板的血液。通常,样品为循环血液的集合。根据一些实施方案,样品为未隔离(sequester)在淋巴系统、脾、肝或骨髓内的外周血样品。
根据一些实施方案,样品为血浆样品。根据一些实施方案,样品为来源于外周血的血浆样品。
根据一些实施方案,本文描述的多种生物标志任选地包括生物标志的任何亚组合,和/或以至少一种其他生物标志例如已知的生物标志为特征的组合。
根据一些实施方案,如本文描述的,多种生物标志与结肠直肠癌相关。
根据一些实施方案,如本文使用的术语“多种”指至少两种。根据一些实施方案,术语“多种”指至少2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种及17种。
根据一些实施方案,“测量表达水平”包括评价临床或受试者来源的样品内的给定物质(通常为mRNA或cDNA)的存在、不存在、量或相对量(其可以为“有效量”),包括此类物质的定性或定量浓度水平,或以其他方式评价受试者的临床参数的值或分类。
根据一些实施方案,“测量表达水平”包括确定所述多种生物标志的mRNA表达水平或确定对应一种或更多种mRNA生物标志的表达水平的cDNA的量或相对量。
根据一些实施方案,生物标志的截断值指区分健康受试者群体与非健康受试者群体的表达水平。根据一些实施方案,在健康受试者群体中,SEQ ID NO:1至17中列出的每种生物标志的水平低于所述生物标志的每一种的截断值。
根据一些实施方案,截断值为统计学显着的值。根据一些实施方案,截断值的p值为至多0.05。根据一些实施方案,至少一种生物标志的表达水平高于或低于所述至少一种生物标志的所述截断值确定了受试者的CRC状态。
根据一些实施方案,确定每种生物标志的截断值包括测量为健康的、患有癌前进展期息肉或患有结肠直肠癌的大的受试者群体中的所述至少一种生物标志的表达水平。
根据一些实施方案,本发明的方法还包括逆转录每种mRNA生物标志并获得相应的互补DNA(cDNA)。根据一些实施方案,测量每种cDNA的量通过定量聚合酶链式反应(qPCR)进行。
根据一些实施方案,表达水平通过定量实时PCR(qRT-PCR)测量。
根据一些实施方案,优选地选择寡核苷酸对以具有兼容的解链温度(Tm),例如,相差小于7℃、优选地小于5℃、更优选地小于4℃、最优选地小于3℃、理想地在3℃和0℃之间的解链温度。
如本文使用的,定量聚合酶链式反应(qPCR)为一种使用荧光探针定量测量DNA的扩增的方法。该技术利用具有附连至5'末端的荧光探针和附连至3'末端的猝灭物的寡核苷酸探针。在PCR扩增期间,这些探针与位于扩增子中的靶序列杂交,并且当聚合酶复制具有结合的探针的模板时,由于聚合酶5'-核酸酶活性,聚合酶还切割荧光探针。由于猝灭物分子和荧光探针之间的紧密接近通常阻止荧光被检测到,解偶联导致与探针切割循环的数目成比例的荧光强度的增加。
根据一些实施方案,期望的靶序列的区段的长度由引物相对于彼此的相对位置确定,并因此该长度是可控参数。由于靶序列的期望的区段成为混合物中的优势序列(在浓度方面),它们被称为“PCR扩增的”。许多变量可影响PCR的平均效率,所述变量包括,仅举几例,靶DNA长度和二级结构、引物长度和设计、引物和dNTP浓度、以及缓冲液组成。与外源DNA(例如,溢出到实验室表面上的DNA)反应的污染或交叉污染也是主要考虑因素。这些反应条件必须针对每种不同的引物对和靶序列小心优化。
根据一些实施方案,确定生物标志的表达水平可包括经由本领域已知的任何方法以及如本文描述的检测特定核酸序列的表达或表达水平。
根据一些实施方案,确定cDNA或mRNA的量和/或浓度通过采用至少一种探针或至少一种引物,优选地引物对来进行。通常,核酸探针或引物适合于检测本发明的特定生物标志的表达或表达水平。
如本文使用的,“引物”定义了能够与靶序列退火(杂交),从而产生可在适合的条件下作为DNA合成的起始点的双链区域的寡核苷酸。
根据一些实施方案,术语“引物对”在本文中指根据本发明的至少一些实施方案的一对寡核苷酸(oligonucleotide)(寡核苷酸(oligo)),其被选择一起用于通过许多类型的扩增方法中的一种、优选地聚合酶链式反应扩增选择的核酸序列。其他类型的扩增方法包括连接酶链式反应、链置换扩增或基于核酸序列的扩增,如下文更详细地解释的。如本领域通常已知的,寡核苷酸被设计为在选择的条件下与互补序列结合。
根据本发明的一些实施方案,取决于特定的测定形式和特定的需求以及采用的靶基因组,寡核苷酸引物可具有任何适合的长度。任选地,寡核苷酸引物的长度为至少12个核苷酸、优选地在15个和24个分子之间,并且它们可被改变以特别适合于选择的核酸扩增系统。如本领域通常已知的,寡核苷酸引物可通过考虑其与其靶序列杂交的解链点来设计(Sambrook等,1989,Molecular Cloning-A Laboratory Manual,第2版,CSHLaboratories)。
根据一些实施方案,本发明的生物标志的表达水平使用表2中列出的引物确定。
根据一些实施方案,诊断测定的“灵敏度”为测试为阳性的患病个体的百分比(“真阳性”的百分比)。通过测定未检测出的患病个体为“假阴性”。未患病且在测定中测试为阴性的受试者称为“真阴性”。诊断测定的“特异度”为一(1)减去假阳性率,其中“假阳性”率被定义为测试为阳性而没有疾病的那些的比例。尽管特定的诊断方法可能不提供状况的确定性诊断,如果该方法提供有助于诊断的阳性指示其就足够了。
根据一些实施方案,当与正常受试者(例如,未患癌症的健康个体)相比时,本文公开的方法以至少19%的灵敏度、至少97%的特异度区分疾病或状况(特别是结肠直肠癌)。根据一些实施方案,当与正常受试者相比时,该方法以至少44%的灵敏度、至少92%的特异度区分疾病或状况。根据一些实施方案,当与正常受试者相比时,该方法以至少56.5%的灵敏度、至少79%的特异度区分疾病或状况。根据一些实施方案,当与表现出模仿疾病或状况症状的症状的受试者相比时,该方法以至少58%的灵敏度、至少92%的特异度区分疾病或状况。根据一些实施方案,当与正常受试者相比时,该方法以至少66%的灵敏度、至少78%的特异度区分疾病或状况。根据一些实施方案,当与正常受试者相比时,该方法以至少100%的灵敏度、至少85%的特异度区分疾病或状况。根据一些实施方案,当与正常受试者相比时,该方法以至少56.5%的灵敏度、至少79%的特异度区分疾病或状况。根据一些实施方案,当与正常受试者相比时,该方法以至少53%的灵敏度、至少81%的特异度区分癌前进展期息肉,并以至少87.5%的灵敏度、至少81%的特异度区分结肠直肠癌。
根据一些实施方案,术语生物标志的“相对量”指受试者的样品中与特定疾病或状况的诊断一致的生物标志的量。相对量可以是绝对量(例如,微克/ml)或相对量(例如,信号的相对强度)。
根据一些实施方案,单独的生物标志和/或生物标志的组合可任选地用于诊断疾病或状况的发作时间。此类诊断可任选地用于多种状况,包括突然发作的那些状况。
技术人员将理解,将指示物与不良结果的倾向相关联为性能(灵敏度&特异度)分析。例如,大于预设截断值的RNA生物标志表达水平可表示患者患有CRC,而小于或等于预设截断值的RNA生物标志表达水平可指示受试者为健康的或未患有CRC。
另外,生物标志浓度从基线水平的变化可反映疾病的状态或其进展(如果牵涉时间监测)或治疗的治疗效果,而生物标志表达水平中的变化程度可与CRC的严重程度相关。统计学显著性通常通过比较两个或更多个群体,并确定置信区间(CI)和/或p值来确定。
根据一些实施方案,本发明的置信区间(CI)为90%、95%、97.5%、98%、99%、99.5%、99.9%及99.99%,同时优选的p值为小于0.1、0.05、0.025、0.02、0.01、0.005、0.001或小于0.0001。在下文描述了用于鉴定CRC和癌前进展期息肉的示例性统计学检验。
根据一些实施方案,生物样品中的感兴趣的核酸的检测可通过本领域已知的任何方法进行。任选地,感兴趣的核酸的检测通过使用寡核苷酸探针的基于杂交的测定来实现。传统的杂交测定包括PCR、逆转录酶PCR、实时PCR、定量PCR、定量实时PCR、RNA酶保护、原位杂交、引物延伸、斑点印迹或狭线印迹(RNA)及RNA印迹(即,用于RNA检测)。其他检测方法包括含有在试纸条(dipstick)设置上的探针的试剂盒等。
根据一些实施方案,探针可根据许多熟知的方法来标记。可检测标志的非限制性实例包括配体、荧光团、化学发光剂、酶及抗体。与探针一起使用的可以能够增加本发明方法的灵敏度的其他可检测标志包括生物素和放射性核苷酸。普通技术人员将明白,特定标记物的选择决定了它与探针结合的方式。
根据一些实施方案,探针选自表2中列出的探针。
根据一些实施方案,探针寡核苷酸可在合成后通过掺入生物素化的dNTP或rNTP或一些类似的方法(例如,将生物素的补骨脂素衍生物光交联至RNA)、随后添加标记的链霉亲和素(例如,藻红蛋白缀合的链霉亲和素)或等同物来标记。可选地,当使用荧光标记的寡核苷酸探针时,可将荧光素、FAM、丽丝胺、藻红蛋白、罗丹明、Cy2、Cy3、Cy3.5、Cy5、Cy5.5、Cy7、FluorX以及其他附连至寡核苷酸。优选地,本发明的生物标志的检测通过使用TaqMan测定、优选地通过使用组合的报告物和猝灭物分子(Roche Molecular Systems Inc.)来实现。
根据一些实施方案,生物样品中的感兴趣的核酸的检测还可任选地通过基于NAT的测定来实现,所述基于NAT的测定牵涉核酸扩增技术,诸如例如PCR(或其变化形式,诸如例如qPCR)。
选择的或靶核酸序列的扩增可通过许多适合的方法进行。许多扩增技术已被描述并可容易地被改变以适应普通技术人员的特定需求。扩增技术的非限制性实例包括聚合酶链式反应(PCR)、连接酶链式反应(LCR)、链置换扩增(SDA)、基于转录的扩增、q3复制酶系统及NASBA。
根据一些实施方案,来自受试者的核酸样品在有利于扩增最丰富的差异表达的核酸的条件下被扩增。根据一些实施方案,对来自患者的mRNA样品进行逆转录成cDNA。根据一些实施方案,差异表达的核酸的扩增同时进行。本领域技术人员将认识到,此类方法可适应于检测差异表达的蛋白而不是差异表达的核酸序列。
根据一些实施方案,用于实践本发明的核酸(例如,mRNA)可根据熟知的方法获得。
根据一些实施方案,检测还可任选地用芯片或其他此类装置来进行。包括待分析的候选区域的核酸样品任选地被分离、扩增并用报告物基团标记。该报告物基团可以是荧光基团诸如藻红蛋白。然后,使用流体学配置(fluidics station)将标记的核酸与固定化在芯片上的探针一起孵育。在反应完成后,将芯片插入扫描仪并检测杂交的模式。当信号从已被掺入核酸的报告物基团发射时,收集杂交数据,所述核酸现与附连至芯片的探针结合。由于固定化在芯片上的每个探针的序列和位置是已知的,可确定与给定的探针杂交的核酸的身份。
将领会的是,当与自动化设备一起使用时,以上描述的检测方法可被用来既快速又容易地筛查多个样品的疾病和/或病理状况。
根据一些实施方案,提供了用于鉴定生物样品中的结肠直肠癌或癌前进展期结肠直肠息肉的试剂盒,所述试剂盒包含一种或更多种容器,所述容器填充有在包含SEQ IDNO:1中列出的核酸序列的生物标志侧翼的核苷酸引物对,其中所述核苷酸引物对被设计为选择性扩增所述样品中个体基因组的包含生物标志的片段。
根据一些实施方案,核苷酸引物对选自表2中列出的核苷酸引物对。
根据一些实施方案,所述核苷酸引物对包含SEQ ID NO:40和41。
根据一些实施方案,所述生物标志还包含选自SEQ ID NO:2、3、5-7、12和17的至少一种核酸序列,且所述核苷酸引物对分别包含以下的至少一种:SEQ ID NO:30和31、SEQ IDNO:34和35、SEQ ID NO:67和68、SEQ ID NO:49和50、SEQ ID NO:52和53、SEQ ID NO:64和65以及SEQ ID NO:73和74。
根据一些实施方案,所述生物标志包含SEQ ID NO:1-3、5-7、12和17中列出的核酸序列,所述核苷酸引物对包含SEQ ID NO:40和41、SEQ ID NO:30和31、SEQ ID NO:34和35、SEQ ID NO:67和68、SEQ ID NO:49和50、SEQ ID NO:52和53、SEQ ID NO:64和65以及SEQ IDNO:73和74,且所述试剂盒用于鉴定结肠直肠癌。
根据一些实施方案,所述生物标志由SEQ ID NO:1-3、5-7、12和17中列出的核酸序列组成,所述核苷酸引物对包含SEQ ID NO:40和41、SEQ ID NO:30和31、SEQ ID NO:34和35、SEQ ID NO:67和68、SEQ ID NO:49和50、SEQ ID NO:52和53、SEQ ID NO:64和65以及SEQID NO:73和74,且所述试剂盒用于鉴定结肠直肠癌。
根据一些实施方案,所述生物标志包含SEQ ID NO:1和5中列出的核酸序列,所述核苷酸引物对包含SEQ ID NO:95和96以及SEQ ID NO:67和68,且所述受试者被鉴定为患有癌前进展期结肠直肠息肉。
根据一些实施方案,所述生物标志由SEQ ID NO:1和5中列出的核酸序列组成,所述核苷酸引物对包含SEQ ID NO:40和41以及SEQ ID NO:67和68,且所述受试者被鉴定为患有癌前进展期结肠直肠息肉。
根据一些实施方案,所述生物标志包含SEQ ID NO:1以及选自SEQ ID NO:3、4、6和14的至少一种核酸序列,且所述核苷酸引物对分别包含SEQ ID NO:40和41,以及SEQ IDNO:34和35、SEQ ID NO:55和56、SEQ ID NO:49和50、SEQ ID NO:61和62的至少一种。
根据一些实施方案,所述生物标志包含SEQ ID NO:1和4以及选自SEQ ID NO:3、6和14的至少一种核酸序列,且所述核苷酸引物对分别包含SEQ ID NO:40和41以及SEQ IDNO:55和56,以及SEQ ID NO:34和35、SEQ ID NO:49和50、SEQ ID NO:61和62的至少一种。
根据一些实施方案,所述生物标志包含SEQ ID NO:1、3和4,且所述核苷酸引物对包含SEQ ID NO:40和41、SEQ ID NO:34和35以及SEQ ID NO:55和56。
根据一些实施方案,所述生物标志包含SEQ ID NO:1、4、6和14,且所述核苷酸引物对包含SEQ ID NO:40和41、SEQ ID NO:55和56、SEQ ID NO:49和50以及SEQ ID NO:61和62。
根据一些实施方案,所述生物标志包含SEQ ID NO:1、3、4和14,且所述核苷酸引物对包含SEQ ID NO:40和41、SEQ ID NO:34和35、SEQ ID NO:55和56以及SEQ ID NO:61和62。
根据一些实施方案,术语“癌症”和“结肠直肠癌”是可互换的。
根据一些实施方案,癌症为浸润性的。根据其他实施方案,癌症为非浸润性的。根据又其他实施方案,癌症为非转移性的。根据一些实施方案,癌症为转移性的。根据一些实施方案,癌症为结肠直肠癌的转移瘤。
根据一些实施方案,本发明的试剂盒和方法用于监测处于结肠直肠癌高风险的个体,诸如,在过去已被诊断患有局限性疾病、转移性疾病的个体或在遗传上与疾病相关的个体,或具有在过去被诊断患有癌症的一级亲属和二级亲属的家庭成员(family members offirst and second degree)的个体。具有结肠炎性状况诸如溃疡性结肠炎或克罗恩结肠炎病史的个体也可被认为是处于结肠直肠癌高风险群体中的个体。根据本发明的分子诊断可用于监测正经历结肠直肠癌或已针对结肠直肠癌治疗的个体,以便确定癌症是否已被消除。根据本发明的筛查和诊断试剂盒及方法可用于监测已诸如通过遗传筛查和/或家族史被鉴定为有遗传倾向的个体。根据本发明的筛查和诊断试剂盒及方法可以用于监测无症状的个体,无论是否被鉴定为有遗传倾向的。
本发明对鉴定显示出癌症的至少一种症状或特征,例如结肠中息肉的存在的个体是有用的。
根据一些实施方案,本发明用于监测已被鉴定为具有家族医疗史的个体,所述家族医疗史包括罹患结肠直肠癌的亲属。同样地,本发明对监测已被治疗并且肿瘤被去除或以其他方式经历缓解的个体是特别有用的。
根据一些实施方案,本发明还提供了一种用于治疗患有结肠直肠癌的受试者的方法,所述方法包括:鉴定患有结肠直肠癌或癌前进展期结肠直肠息肉的受试者,以及治疗所述受试者,其中治疗包括以下的至少一种:施用化疗剂、进行肠切除、应用放射疗法及其组合。
根据一些实施方案,化疗剂包括但不限于5-氟尿嘧啶、亚叶酸或奥沙利铂或卡培他滨;和/或单克隆抗体,诸如贝伐单抗、西妥昔单抗或帕尼单抗或替代性单克隆抗体,或其组合。每种可能性是本发明的单独的实施方案。
根据一些实施方案,治疗受试者的癌前进展期息肉包括去除所述癌前进展期息肉。
根据一些实施方案,去除所述癌前进展期息肉包括进行以下的一种或更多种:结肠镜检查、柔性乙状结肠镜检查和开放手术。每种可能性是本发明的单独的实施方案。
根据一些实施方案,根据本发明的所述受试者的鉴定、诊断、早期诊断和/或预后使本领域技术人员(即,临床医师或医师)能够确定和/或管理受试者治疗方案。管理受试者治疗包括确定癌性状态(例如,癌症状态)的严重程度。例如,如果癌性状态的严重程度指示手术是适合的,则医师可安排患者进行手术。同样地,如果癌性状态的严重程度指示晚期癌症或者如果状态是急性的,则进一步的行动可能不被批准。此外,如果结果显示治疗已经成功,则另外的管理或治疗可以不是必需的。可选地,如果本发明的方法的结果是不确定的或者存在需要确定状态的理由,则医师可安排更多的诊断测试。因此,被发现具有至少一种生物标志的表达水平高于截断值的患者可经历另外的诊断程序,所述至少一种生物标志的表达水平高于截断值将所述患者鉴定为患有结肠直肠癌。
如本文使用的,“受试者”通常指哺乳动物受试者。哺乳动物受试者可以为人或非人、优选地为人。
根据一些实施方案,健康受试者被定义为未患有通过常规诊断方法确定的结肠直肠疾病或症状、结肠直肠相关的疾病或癌前进展期息肉的受试者。
如上文描写的以及如下文权利要求部分要求保护的本发明的多个实施方案和方面在以下实施例中获得实验性支持。
实施例
实施例1-研究群体和样本制备
至少50岁且被安排结肠镜检查的受试者参与了该研究。为了确保仅平均风险的个体被登记,将以下排除在研究之外:先前的CRC或腺瘤;在先前6个月内的缺铁性贫血或便血(haematochezia)(血液在粪便中);或指示疾病的增加的风险的家族史(患有CRC的两个或更多个一级亲属或在50岁或以下患有CRC的一个或更多个一级亲属;或已知的Lynch综合征或家族性腺瘤性息肉病)。
结肠镜检查程序包括息肉切除术和活检通过委员会认证的内窥镜医师(boardcertified endoscopist)使用用于镇静、监测、成像及设备的筛查标准和部位特定标准来进行。活检和手术样本的组织病理学、诊断程序和分期使用常规程序。来自137名受试者的样品可用于选择进入实验室分析,包括55名正常受试者、47名患有进展期腺瘤以及35名患有CRC。研究组的临床以及组织学参数描述于表1A中。
表1A:
在征募用于研究的患者同意之后,在手术或结肠镜检查之前使用收集管(vacutainer)提供约10ml血液。收集的血液保持冷藏直至进一步处理(多达收集后4小时)。
通过离心将血浆与血细胞分离。将血浆用
总RNA提取根据以下方案进行:将300μl氯仿(119.38g/mol)添加至包含相同个体的TRIzolTM-血浆混合物的四个微管的每一个中。将溶液剧烈混合并在室温孵育10分钟。随后,将混合物在4℃以14,000rpm离心15分钟。将水相转移至新管中并与等体积的氯仿剧烈混合,在室温孵育3分钟,并在4℃以14,000rpm离心15分钟。在离心后,将上层相转移至新的微管中;然后,添加来自RNeasyTM微型试剂盒(Qiagen)的总计1.4ml>TM旋转柱(Qiagen)上,并在23℃、10,000g微离心30秒,并弃去流出液(flow-through)。如以上描述的,装载解冻样品的剩余部分,并将柱离心,直至所有溶液通过RNeasyTM旋转柱过滤。进一步的RNA纯化通过遵循RNeasyTM微型试剂盒操作方案(Qiagen)完成。简言之,将旋转柱用样品装载,并用500μl>TM仪器(Thermo>
为了使用基因表达芯片阵列测试基因表达谱,总RNA使用在冰上解冻的相同个体的TRIzol-血浆混合物来纯化,并且每1ml Trizol添加15mg线性梯度丙烯酰胺(linearacrylamide)和200μl氯仿并剧烈混合。在室温孵育10分钟之后,将混合物在4℃以14000rpm离心15分钟。分离水相,并如以上关于qPCR的RNA样本制备描述的进行进一步的RNA纯化步骤。
为了通过qPCR测试基因表达水平,将10微升血浆RNA用于每个cDNA反应。逆转录酶反应用qScript缓冲液混合物和RT酶进行。将产生的cDNA储存在-20℃。对于使用Affymetrix表达微阵列的基因表达谱分析,cDNA被合成、纯化并经历片段化和生物素标记。
实施例2-表达水平的定量
最初,测试不同亚群中72个基因以确定其表达水平,其中17个基因(表1B)被选择为用于检测结肠直肠癌的生物标志的组。
表1B:
随后,将所需体积的cDNA稀释x4,其中2μl用于qPCR。对于典型的qPCR反应,将PerfeCTa qPCR SuperMix(目录号95065,Quanta)与每个基因特异性的正向引物和反向引物(表2)集、水解探针及稀释的cDNA以20μl的终体积一起使用。qPCR在ABI Prism 7900系统中在Quanta的指定条件下在96孔PCR板中进行52个循环。表2中列出的荧光标记的探针包括以下标记物的一种或更多种:在5’末端的FAM(还称为56-FAM)、在3’末端的IABkFQ,并且还可包括N,N-二乙基-4-(4-硝基萘-1-基偶氮)-苯胺(还称为‘ZEN’)。ZEN可在任何位置处被掺入。例如,ZEN可在距离3'末端的位置9、距离3'末端的位置10处或在探针中间(使得从ZEN位置起计数的约相同数目的核苷酸在3'和5'方向上延伸)被掺入。用于归一化的参考基因为人HPRT1和人TFRC。对于每个基因的Δ-ΔCt(delta-delta Ct)及相对定量通过DataAssist v3.0计算。参考基因引物和探针序列如下:hHPRT1基因,正向引物-TATGCTGAGGATTTGGAAAGG(SEQ ID NO:18),反向引物-CATCTCCTTCATCACATCTCG(SEQ ID NO:19;终浓度300nM),探针-添加4个LNA的FAM-TATGGACAGGACTGAACG-3'IABkFQ(SEQ ID NO:20)(终浓度200nM)。hTFRC正向引物-TTGCATATTCTGGAATCCCA(SEQ ID NO:21),反向引物-TCAGTTCCTTATAGGTGTCCATG(SEQ ID NO:22;终浓度500nM),探针-添加5个LNA的FAM-TCTGTGTCCTCGCAAAAA-3'IABkFQ(SEQ ID NO:23)(终浓度250nM)。该过程的示例性流程图示于图1中。
确定用于cDNA的引物和探针终浓度用100倍范围校准曲线以6个cDNA稀释度进行。显示出在R2>0.95的准确度的校准曲线最佳斜率(-3.3)的引物和探针浓度被选择作为用于每个基因的最佳浓度(图2)。
表2:
实施例3-数据分析
如图2中示意性例示的,基于特定分子标志及其组合的存在或不存在,通过全结肠镜检查的癌前息肉、结肠腺癌或正常结肠的存在被鉴定。对于所有的统计分析,应用SPSS包,版本21(IBM SPSS Statistics)。
首先,从经历结肠镜检查的受试者收集血液。从而,结肠镜检查的结果和其中采集活检样品的病例的病理报告或癌性病例的病理报告被用作研究组的状态的参考。该方法还用来鉴定可提供进展期腺瘤和癌症疾病状态的最佳生物标志的基因组合。如以上详述的,研究组(表1A)被设计为由正常受试者(n=55)、进展期腺瘤(AA;n=47)及结肠直肠癌(CRC;n=35)的3个受试者组组成。
通过qPCR的基因表达的归一化是基于在血浆中稳定表达的两个参考基因的表达:HPRT1和人TFRC。引物-探针比率针对低RNA量来校准,在3个数量级的cDNA浓度中产生最佳PCR效率(线性动态范围)。
所有PCR结果被记录为通过下式:RQ=2^(-ΔCt)计算的相对量(RQ),其中ΔCt为测量的候选检测物基因标志与参考管家基因hHPRT1和TFRC的Ct之间的差。确定截断值以确保所有健康受试者(正常)低于该截断值。代表性生物标志的截断值列于表3中。
表3:
应用几种分析方法以基于来源于从健康受试者、患有癌前进展期息肉的受试者和患有结肠直肠癌的受试者采集的样品的数据确定疾病的状态。
进一步确立的是,通过采用生物标志的组合,改进了结肠直肠癌的鉴定的灵敏度而不损害特异度。为了在对应于组合中的每种生物标志的表达水平范围的不同值之间进行比较,应用组合数据分析算法。在选择生物标志的组合后,将组合中的每种生物标志的表达水平与其截断值进行比较。代表性生物标志的截断值列于表3中。使用该算法,如果组合中的每种生物标志的表达水平低于其预定的截断值,则将值1分配给生物标志的组合。如果所述组合中的至少一种生物标志的表达水平高于其预定的截断值,则将值2分配给生物标志的组合。所分配的值(1或2)在本文也被称为归一化的表达水平。健康(N)、癌前(AD)及癌症(CA)群体中组合COX11、KIAA1199和BAD(SEQ ID NO:9、14和2;表4A)以及CHD2和EPAS1(SEQID NO:1和6;表4B)的归一化的表达水平分别呈现于图4A和4B中,其中高于截断值的表达水平以粗体呈现(图4A和4B)。
表4A:
表4B:
实施例4-结肠直肠癌的鉴定
为了用至少一种生物标志鉴定结肠直肠癌,选择为最高的针对癌症的生物标志的灵敏度和特异度并且为最小的针对癌前进展期息肉的灵敏度。考虑到具有表达水平高于预定的截断值的生物标志,单个生物标志分析的结果在下文呈现于表5中。例如,如在表5中示出的,CHD2(SEQ ID NO:1)在结肠直肠癌的检测中显示出97%的特异度和19%的灵敏度。
生物标志的组合或亚组可被用于通过应用组合数据分析算法将受试者鉴定为患有结肠直肠癌,而不损害特异度。
如表6中示出的,与单独的每种生物标志的灵敏度相比,组合数据分析可增加两种生物标志BAMBI(SEQ ID NO:3)和HNRNHP3(SEQ ID NO:4)的鉴定的灵敏度。
在表7中示出了,与每种生物标志的灵敏度相比,组合数据分析可增加两种生物标志CHD2(SEQ ID NO:1)和EPAS1(SEQ ID NO:6)的鉴定的灵敏度。
在表8中示出了,与每种生物标志的灵敏度相比,组合数据分析增加了三种生物标志BAMBI(SEQ ID NO:3)、HNRNPH3(SEQ ID NO:4)和CHD2(SEQ ID NO:1)的鉴定的灵敏度。
表5:
表6:
表7:
1组如在表6中的被分配诊断。
表8:
2组如在表6中的被分配诊断。
在表9中示出了,与每种生物标志的灵敏度相比,组合数据分析增加了四种生物标志CHD2(SEQ ID NO:1)、EPAS1(SEQ ID NO:6)、HNRNPH3(SEQ ID NO:4)和KIAA1199(SEQ IDNO:13)的鉴定的灵敏度。
表9:
3组如在表6中的被分配诊断。
在另一种分析方法中,已定义了qPCR ΔCt结果的两个数据集,癌症-健康和AD-健康。计算了基因之间的关系以及病例-健康组间的基因的分散性量度(dispersionmeasure)。
在癌症-健康数据集中,表3中列出的8个基因之间的相关性揭示了彼此高度相关的两个基因聚簇。聚簇1包括基因CHD2、BAD和BAMB1(分别为SEQ ID NO:1-3),且聚簇2包括基因NEK6、FKBP5和SASH3(分别为SEQ ID NO:5、7和17)。根据这些发现结果,产生了以下特征:
1.Max_BAD_BAMBI_CHD2–该特征对应于来自三个基因CHD2、BAD和BAMBI(分别为SEQ ID NO:1-3)的最大值;
2.Max_FKBP5_SASH3_NEK6–该特征对应于来自三个基因NEK6、FKBP5和SASH3(分别为SEQ ID NO:5、7和17)的最大值。
逻辑回归被用于使用以下四种特征开发癌症-健康的分类模型:
a)Max_BAD_BAMBI_CHD2;
b)Max_FKBP5_SASH3_NEK6;
c)EPAS1;以及
d)KLF9。
分析获得了以下模型方程:
Y~max_BAD_BAMBI_CHD2+5x max_FKBP5_NEK6_SASH3+23x EPAS1–3x KLF9-25。
受试者工作特征(ROC)曲线分析被用来评价模型的分离能力(图5)和收益(yield)(84.3%AUC,95%渐近CI:74.8%-93.9%,P值<0.001)。高于85%特异度的点和最大约登指数点(灵敏度+特异度-1)在点0.84处会合,具有75%的性能灵敏度和93%的特异度(图6)。
病例处理小结在表10中提供:
a-根据非参数假设其基因结果为阳性的受试者
b-其基因结果为阴性的受试者(零假设(null hypothesis):真面积=0.5)
c-其结果缺失的受试者
对于健康-AD数据库,t-检验和/或逐步回归模型被用来选择参与模型构建的特征。选择BAD和NEK6(分别为SEQ ID NO:2和5),并且该模型的方程式如下:
Y~BAD+11x NEK6-48
ROC分析被用来评价模型对健康-AD的分离能力(图7)并产生70.5%AUC(95%渐近CI:58.5%-82.5%,P值<0.001)。高于85%特异度的点和最大约登指数点在点2处会合,具有60%的性能灵敏度和87%的特异度(图8)。
病例处理小总在表11中提供:
a-根据非参数假设其基因结果为阳性的受试者
b-其基因结果为阴性的受试者(零假设:真面积=0.5)
c-其结果缺失的受试者
这些分析强烈证明,尽管纯化的血浆RNA不具有良好的质量,鉴定与进展期腺瘤或结肠直肠癌的检测相关的基因仍然是可能的。
以上具体实施方案的描述将如此完全地揭示本发明的一般性质,使得其他人可以通过应用现有的知识,容易地为各种应用修改和/或调整此类具体实施方案而不需要过度实验且不背离一般概念,且因此,此类调整和修改应当并且预期被包含在本公开的实施方案的等价物的含义和范围内。应理解的是,本文采用的措辞或术语是为了描述而非限制的目的。用于进行各种本公开的功能的工具、材料和步骤可采取多种替代形式而不背离本发明。
序列表
<110> 比奥马卡尔技术有限公司
<120> 用于鉴定癌前结肠直肠息肉和结肠直肠癌的方法及试剂盒
<130> BMC005PCD
<150> US 61/977636
<151> 2014-04-10
<160> 91
<170> PatentIn版本3.5
<210> 1
<211> 138
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 1
ccttacagca acagaaagtg aagggcctaa aaaaactaga gaacttcaag aaaaaagagg 60
acgaaatcaa acaatggtta gggaaagttt ctcctgaaga tgtagaatat ttcaattgcc 120
aacaggagct ggcttcag 138
<210> 2
<211> 137
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 2
aggatgagtg acgagtttgt ggactccttt aagaagggac ttcctcgccc gaagagcgcg 60
ggcacagcaa cgcagatgcg gcaaagctcc agctggacgc gagtcttcca gtcctggtgg 120
gatcggaact tgggcag137
<210> 3
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 3
ccgtgctgct caccaaaggt gaaattcgat gctactgtga tgctgcccac tgtgtagcca 60
ctggttatat gtgtaaatct gagc84
<210> 4
<211> 149
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 4
ggaagaggta tgggaggaca tggctatggt ggagctggtg atgcaagttc aggttttcat 60
ggtggtcatt tcgtacatat gagagggttg ccttttcgtg caactgaaaa tgacattgct 120
aatttcttct caccactaaa tccaatacg 149
<210> 5
<211> 148
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 5
cgccctacta catgtcaccg gagaggatcc atgagaacgg ctacaacttc aagtccgaca 60
tctggtccct gggctgtctg ctgtacgaga tggcagccct ccagagcccc ttctatggag 120
ataagatgaa tctcttctcc ctgtgcca148
<210> 6
<211> 99
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 6
agcctatgaa ttctaccatg cgctagactc cgagaacatg accagaactt gtgcaccaag 60
ggtcaggtag taagtggcca gtaccggatg ctcgcaaag99
<210> 7
<211> 142
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 7
tgaagatgga ggcattatcc ggagaaccaa acggaaagga gagggatatt caaatccaaa 60
cgaaggagca acagtagaaa tccacctgga aggccgctgt ggtggaagga tgtttgactg 120
cagagatgtg gcattcactg tg142
<210> 8
<211> 133
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 8
tggctctcct tgtcattttc caggtatgcc tgtgtcaaga tgaggtcacg gacgattaca 60
tcggagacaa caccacagtg gactacactt tgttcgagtc tttgtgctcc aagaaggacg 120
tgcggaactt taa133
<210> 9
<211> 150
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 9
ccagtggaac tttagacctc agcaaacaga aatatatgtg gtgccaggag agactgcact 60
ggcgttttac agagctaaga atcctactga caaaccagta attggaattt ctacatacaa 120
tattgttcca tttgaagctg gacagtattt150
<210> 10
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 10
caacaccttc caccaatact ctgtgaagct ggggcaccca gacaccctga accaggggga 60
attcaaagag ctggtgcgaa aagatctgca aattttctca agaaggagaa taagaatgaa 120
aaggtcatag aacacatcat ggagg 145
<210> 11
<211> 118
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 11
gtcatcaagc acctgaacag gttcaagttc tttcttcaaa gagtcatcag aataacatgg 60
attgaagaga cttccgaaca cttgctatct cttgctgctg ctgtttcatg gaaggaga 118
<210> 12
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 12
ctcccatctc aaagcccatt acagagtgca tacaggtgaa cggccctttc cctgcacgtg 60
gccagactgc cttaaaaagt tctcc 85
<210> 13
<211> 150
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 13
gttttcaatg agtaccagag aatgacaggc cgggacattg agaagagcat ctgccgggag 60
atgtccgggg acctggagga gggcatgctg gccgtggtga aatgtctcaa gaatacccca 120
gccttctttg cggagaggct caacaaggcc150
<210> 14
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 14
gacccaccca catacatcag ggacctctcc atccatcatg ctgcgtcaca gtccatggct 60
ccaatggctt gttgatcaag gacgttgtgg gctataactc tttggg106
<210> 15
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 15
tctgccacta attcgacatc agtttcatcg aggaaagctg aaaataaata tgcaggaggg 60
aaccccgttt gcgtgcgccc aactcccaag tggcaaaaag gaattggaga a111
<210> 16
<211> 150
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 16
aatgagttcc ttctacagtc agatattgac ttcatcatat tggattggtt ccacgctatc 60
aaaaatgcaa ttgacagatt gccaaaggat tcaagttgtc catcaagaaa cctggaatta 120
ttcaaaatcc aaagatcctc tagcactgaa150
<210> 17
<211> 99
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 17
caggaagatg ggcaagatga tggtgaaggc cctgtcagaa gagatggcag acactctgga 60
ggagggctct gcctccccga catctccaga ctacagcct99
<210> 18
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 18
tatgctgagg atttggaaag g 21
<210> 19
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 19
catctccttc atcacatctc g 21
<210> 20
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 20
tatggacagg actgaacg 18
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 21
ttgcatattc tggaatccca 20
<210> 22
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 22
tcagttcctt ataggtgtcc atg 23
<210> 23
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 23
tctgtgtcct cgcaaaaa 18
<210> 24
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 24
tggccgtggt gaaatgtctc aaga 24
<210> 25
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 25
ggccttgttg agcctctc 18
<210> 26
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 26
gttttcaatg agtaccagag aatgac 26
<210> 27
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 27
cagattgcca aaggattcaa gttgtcca 28
<210> 28
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 28
ttcagtgcta gaggatcttt gg 22
<210> 29
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 29
aatgagttcc ttctacagtc agat 24
<210> 30
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 30
ctggagcttt gccgcatctg c 21
<210> 31
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 31
aggatgagtg acgagtttgt g 21
<210> 32
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 32
ctgcccaagt tccgatcc 18
<210> 33
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 33
ttcgatgcta ctgtgatgct gccc 24
<210> 34
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 34
ccgtgctgct caccaaa 17
<210> 35
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 35
gctcagattt acacatataa ccagtg 26
<210> 36
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 36
tgacctcatc ttgacacagg catacc 26
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 37
ttaaagttcc gcacgtcctt 20
<210> 38
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 38
tggctctcct tgtcattttc c 21
<210> 39
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 39
cgaaatcaaa caatggttag ggaaagtttc tcc 33
<210> 40
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 40
ccttacagca acagaaagtg aag 23
<210> 41
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 41
ctgaagccag ctcctgtt 18
<210> 42
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 42
agcaagtgtt cggaagtctc ttcaatcc 28
<210> 43
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 43
tctccttcca tgaaacagca g 21
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 44
gtcatcaagc acctgaacag 20
<210> 45
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 45
aaaacgccag tgcagtctct cct 23
<210> 46
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 46
ccagtggaac tttagacctc ag 22
<210> 47
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 47
aaatactgtc cagcttcaaa tgg 23
<210> 48
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 48
agagtcacca gaacttgtgc accaa 25
<210> 49
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 49
agcctatgaa ttctaccatg cg 22
<210> 50
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 50
ctttgcgagc atccggta 18
<210> 51
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 51
tcaaacatcc ttccaccaca gcgg 24
<210> 52
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 52
cacagtgaat gccacatctc t 21
<210> 53
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 53
tgaagatgga ggcattatcc g 21
<210> 54
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 54
ttcaggtttt catggtggtc atttcg 26
<210> 55
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 55
ggaagaggta tgggaggaca 20
<210> 56
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 56
cgtattggat ttagtggtga gaag 24
<210> 57
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 57
aaacggggtt ccctcctgca tatt 24
<210> 58
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 58
tctgccacta attcgacatc ag 22
<210> 59
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 59
ctccaattcc tttttgccac tt 22
<210> 60
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 60
cctctccatc catcatacat tctctcgct 29
<210> 61
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 61
gacccaccca catacatcag 20
<210> 62
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 62
cccaaagagt tatagcccac aa 22
<210> 63
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 63
agtgcataca ggtgaacggc cc 22
<210> 64
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 64
ggagaacttt ttaaggcagt ctg 23
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 65
ctcccatctc aaagcccatt 20
<210> 66
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 66
aggatccatg agaacggcta caacttc 27
<210> 67
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 67
tggcacaggg agaagagat 19
<210> 68
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 68
cgccctacta catgtcacc 19
<210> 69
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 69
agctctttga attccccctg gttca 25
<210> 70
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 70
cctccatgat gtgttctatg acc 23
<210> 71
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 71
caacaccttc caccaatact ct 22
<210> 72
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 72
agaagagatg gcagacactc tggagg 26
<210> 73
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 73
aggctgtagt ctggagatgt c 21
<210> 74
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 多核苷酸
<400> 74
caggaagatg ggcaagatga 20
<210> 75
<211> 9374
<212> DNA
<213> 智人(HOMO SAPIENS)
<400> 75
ctcagagctg ggaaggaggc tctagatggc ggctgtgcct tagagagagc gcgctctgct 60
ccctgccttt gcctcacttt acgcaacttt ccctaacttt cgggcagcct cagggggccc 120
ccgtagcccc ctgcctttcc tagggactta ctggggtcga ttcgaacctt tttttgggag 180
aaaagcagct tttaggagct ttcttttcgt gccttgttgg aaagaagcag ccgtactgag 240
agcccaggtc gttgtttttt ccagcttaga agccatggcg cacctccatt tttgtgcgct 300
ctcctaatga ggtttttttt ctttcggacc tgttttagta ttaattattg ctttattttt 360
ttgaccagtt aacatatttg agggttattt tatttatttt tcgtttttta acggaggatt 420
ttgcctttat ttttaattat ttgggatctg atatttttct actagtagat aggactcttg 480
gtttggacat actacatgga tcagtaaata cctgggcaca ggacttcaaa gcaaacacag 540
attccccctc ccccttaata tttaagaatt aaaagatgat gagaaataag gacaaaagcc 600
aagaggagga cagttcgcta cacagcaatg catcgagtca ctcagcctct gaagaagctt 660
cgggttcaga ctcaggcagt cagtcggaaa gtgagcaggg aagtgatcca ggaagtggac 720
atggcagcga gtcgaacagc agctctgaat cttctgagag tcagtcggaa tctgagagcg 780
aatcagcagg ttccaaatcc cagccagtcc tcccagaagc caaagagaag ccagcctcta 840
agaaggaacg gatagctgat gtgaagaaga tgtgggaaga atatcctgat gtttatgggg 900
tcaggcggtc aaaccgaagc agacaagaac catcgcgatt taatattaag gaagaggcaa 960
gtagcgggtc tgagagtggg agcccaaaaa gaagaggcca gaggcagctg aaaaaacaag 1020
aaaaatggaa acaggaaccc tcagaagatg aacaggaaca aggcaccagt gcagagagtg 1080
agccagaaca aaaaaaagta aaagccagaa gacctgtccc cagaagaaca gtgcccaaac 1140
ctcgtgttaa aaagcagccg aagactcagc gtggaaagag aaaaaagcaa gattcttctg 1200
atgaggatga tgatgatgac gaagctccca aaaggcagac tcgtcgaaga gcggctaaaa 1260
acgttagtta caaagaagat gatgactttg agactgactc agatgatctc attgaaatga 1320
ctggagaagg agttgatgaa cagcaagata atagtgaaac tattgaaaag gtcttagatt 1380
caagactggg aaagaaagga gccactggag catctactac tgtatatgcg attgaagcta 1440
atggcgaccc tagtggtgac tttgacactg aaaaggatga aggtgaaatc cagtacctca 1500
tcaagtggaa gggttggtct tacatccaca gcacatggga gagtgaagaa tccttacagc 1560
aacagaaagt gaagggccta aaaaaactag agaacttcaa gaaaaaagag gacgaaatca 1620
aacaatggtt agggaaagtt tctcctgaag atgtagaata tttcaattgc caacaggagc 1680
tggcttcaga gttgaataaa cagtatcaga tagtagaaag agtaatagct gtgaagacaa 1740
gtaaatctac attgggtcaa acagattttc cagctcatag tcggaagccg gcaccctcaa 1800
atgagcccga atatctatgt aaatggatgg gactccccta ttcagagtgt agctgggaag 1860
atgaagccct cattggaaag aaattccaga attgcattga cagcttccac agtaggaaca 1920
actcaaaaac catcccaaca agagaatgca aggccctgaa gcagagacca cgatttgtag 1980
ctttaaagaa acaacctgca tatttaggag gggagaatct ggaacttcga gattatcagc 2040
tagaaggtct aaactggcta gctcattcct ggtgcaaaaa taatagtgta atccttgctg 2100
atgaaatggg cctaggaaag accatccaga ccatatcatt cctctcctac ctgttccacc 2160
aacaccagct gtatggcccc tttcttatag tcgtcccttt atccaccctc acctcatggc 2220
agagagagtt tgaaatctgg gcaccagaga ttaacgtagt ggtttacata ggtgacctga 2280
tgagcagaaa tacgatacgg gaatatgaat ggattcattc ccaaaccaaa agattgaagt 2340
tcaacgcact tataacaaca tatgagatcc tcttgaaaga taagactgtg ctgggcagta 2400
ttaactgggc ctttctggga gtggatgaag cccatcggtt gaagaatgat gactctttat 2460
tgtataaaac tctgattgat ttcaagtcca accataggct cctgattacg gggacccctc 2520
ttcagaattc cctcaaagag ctctggtcct tgctgcactt tattatgccg gagaagtttg 2580
aattttggga agattttgaa gaagaccatg ggaaggggag agaaaatggc taccagagtc 2640
ttcataaggt gctagagcct ttccttctcc ggagagtcaa aaaagatgtg gagaaatccc 2700
ttcctgctaa agtggaacag attctcaggg tggagatgtc agcccttcag aaacagtatt 2760
acaagtggat tctgaccagg aattacaagg ctcttgccaa aggaacaaga ggcagcacat 2820
ctggttttct taatattgtg atggaactga aaaaatgttg caaccactgc tatctgatta 2880
aaccccctga agaaaatgaa agggaaaatg gacaggagat tcttctgtcc ctcataagga 2940
gcagtgggaa gttgatttta ttagacaaac tgttgacaag acttcgagaa agggggaatc 3000
gagtgcttat cttctctcag atggtgagaa tgttggatat cctggctgaa tacctaacta 3060
ttaaacacta tcctttccag cgtctggatg gttccatcaa gggagaaatc cgaaaacagg 3120
cactggacca cttcaatgca gatgggtctg aggacttctg tttcctgctc tcgacaaggg 3180
ctggtggcct gggaatcaat ttggcttcag cggacacagt cgtcatcttt gactctgact 3240
ggaaccccca gaatgacttg caggcacaag cccgagcgca tagaattggt caaaagaagc 3300
aggtaaatat ttaccgctta gttacaaagg ggactgtgga ggaggagatc atagaacggg 3360
ccaaaaagaa gatggtatta gatcatctgg tgattcagcg catggacacc actggccgga 3420
cgatcctgga aaacaactca ggaaggtcca actcaaatcc ttttaataaa gaagagctga 3480
cagctatttt gaaatttgga gcagaggatc tcttcaaaga actggaaggg gaggaatcag 3540
aacctcagga aatggatata gatgaaattt tgcggttggc tgaaacgaga gagaatgaag 3600
tgtcaacaag tgcaacagat gaacttctat cacagtttaa ggttgccaac tttgcaacaa 3660
tggaagatga agaagagcta gaagagcgtc ctcacaagga ctgggatgag atcattccag 3720
aggaacaaag gaaaaaagta gaggaggaag agcggcagaa ggagctagaa gaaatttata 3780
tgctgcctcg aattcggagt tccactaaaa aggctcagac aaatgacagt gactctgaca 3840
ctgagtctaa gaggcaggcc cagagatcct ctgcttctga gagtgaaacg gaagactctg 3900
atgatgacaa gaagccaaag cgcagagggc gtccgaggag tgtgcggaag gacctcgtgg 3960
agggatttac tgatgcagag atccgaaggt tcatcaaggc ttataagaag tttggtctcc 4020
ctcttgaacg gctggagtgc atagcacgtg atgctgagct ggtagataag tcggtggcag 4080
atctgaagcg cctgggtgaa ctgatccaca acagctgtgt gtcagcaatg caggaatacg 4140
aagagcagct gaaagaaaat gccagcgagg gaaaaggacc agggaaaagg agaggtccaa 4200
caatcaagat atccggagtt caggttaatg tgaaatccat tatccaacat gaagaggagt 4260
ttgagatgct gcataaatct atccctgtgg accctgaaga aaaaaaaaaa tactgcttaa 4320
cctgtcgtgt caaagctgca cattttgatg tagagtgggg ggtggaagat gattctcgcc 4380
tgttgctggg gatttatgaa catggctatg gaaactggga gttaattaaa acagacccag 4440
agcttaaatt aactgacaaa attctgccgg tggagacaga taaaaagcct caggggaagc 4500
agctacagac ccgagcggat tacttgttga agctgctcag aaagggtctg gagaagaagg 4560
gggctgtgac aggtggggaa gaggccaaat taaagaagcg gaagcctcgg gtaaagaagg 4620
aaaacaaagt gcccaggctg aaagaggagc atggaattga gctttcatct cctaggcatt 4680
cagataatcc atcagaagag ggagaagtga aagatgatgg cttggaaaaa agtccaatga 4740
aaaaaaaaca gaagaagaaa gagaacaagg agaacaagga gaaacaaatg agttctagga 4800
aagacaaaga aggggacaag gaaagaaaga agtcaaaaga taagaaagag aagcctaaaa 4860
gtggtgatgc caaatcttcg agtaaatcaa agcgatctca gggtcctgtc catattacag 4920
caggaagtga acctgtcccc attggagagg atgaggatga tgatctggac caggagacat 4980
tcagcatatg taaggagagg atgaggcccg tgaaaaaggc actgaaacag ctcgacaaac 5040
ctgacaaggg gctcaacgtg caagaacagc tggaacacac ccggaactgc ctgctgaaaa 5100
tcggagaccg gatagccgag tgccttaaag cctactcaga tcaggagcac atcaaactct 5160
ggaggaggaa cctatggatt tttgtttcca agtttacaga atttgatgct cgaaaactgc 5220
ataagttata caagatggct cataagaaaa ggtctcaaga agaagaggag caaaagaaga 5280
aagacgacgt gactgggggt aagaaaccat ttcgtccaga ggcctcaggc tccagccggg 5340
actctctgat atctcagtcc catacctcac acaaccttca ccctcagaag cctcatttgc 5400
ctgcctccca tggcccacag atgcatggac acccaagaga taactacaat caccccaaca 5460
agagacactt cagtaatgca gatcgaggag actggcagag ggaaagaaag ttcaactatg 5520
gtggtggcaa caacaatcca ccatggggaa gcgacaggca ccatcagtat gagcagcact 5580
ggtacaagga ccaccattat ggggaccggc gacatatgga tgcccaccgt tccggaagct 5640
atcgacccaa caacatgtcc agaaagaggc cttatgacca gtacagcagt gaccgagacc 5700
accggggaca cagagattat tatgacaggc accatcatga ctccaagcgg aggagatccg 5760
atgaatttag gcctcaaaat taccaccagc aggatttccg acgaatgtct gatcaccgcc 5820
ccgctatggg ctaccatggc cagggaccct cagaccatta ccgctctttc cacacagata 5880
aactggggga atataaacag cctctacccc cattgcaccc tgcagtctca gatcctcgct 5940
cacccccttc tcagaaatct cctcacgatt ccaagtcacc cctggatcat aggtctcctt 6000
tggagagatc actagaacag aaaaacaacc cagattataa ctggaatgtt cggaaaacat 6060
aaaggacagc tcgtaaagga gagagtaaga gtcaccaaac acgtggatat ttttggtctg 6120
atcctacagt agccggttat ctagaccagt aagtggagtt ttggacatgc tgctgctgtc 6180
aactcactgg ctgaaggagc acttcaagga atgggaggcc tttcactggg tccagctctg 6240
attcgggtca ccactcctgc actttggcac cccatcccat tccagcctag ttctggcctc 6300
ccactttgac gggcacttgg aggaggagct gactgtgtgt gtaccagctt cactgggatg 6360
tgtttcccca gtcaaggaac aggggatctt cagagtcatg aatgttttct tgccagggtc 6420
agtgttccca ggaccttagt gcatggtcgg ggcaggaact ggtgcatgga ggctgctggg 6480
acctggtgaa cagtgtgtga tttggttgat ttggttcact ctgacatgat ggatgctgct 6540
gatggggagt ggcgagttgg ggcaagcggg tggggacaag cataggactt gaaggggagc 6600
aggtacaccc ctcaaatgtg ttcttgggag aagtgataca ctcggcctca ttatgtgaaa 6660
cctgtgggtg gggttggggt ggagaagtag agagagggca acagcttcca caactgcttc 6720
atctctgcca acactaattt ttcccacact gtctttgtac atttcagagc tttggtctcc 6780
tgagtgggcc tccttttccc actgtgccag ggaaggtagg tttctctggc tgactgagta 6840
ctgtgagtga ggcaacactg atgccagcat gggtcttact tgactgggga gtaggctgag 6900
tgaggggtag ggtggggtag gtggggagta gtgtggccag ggaactggaa tccctggtgg 6960
atttctgatt cctgtggtga gaaggaaagc tacaggacct ggagaagggg atgcagaggc 7020
aggcctgctg accaacttgt tgcaatcaca aaggtggggg tcctggtgca ggcagtgaac 7080
aggcttctaa tgtggggttc agtagtgcca gcaagtgggg gaaactttca gtattgcgct 7140
aggtcaacac ttcctgctgc atttccttcc ctttgcacag cttgaagaaa tagagtagac 7200
agaatcacac atcatgtggt gggcagatgg aaataagtac ctgtggtgaa caagtttcta 7260
ctgtagttgg agatcattag aattgaattc agtttctctt agaatataat caggtataaa 7320
cctaagttaa actttttccc aaacaaggag catccaaaga cacagtgact tgagctatag 7380
atagtaaaaa tcatacgaga gttgaactga gtcaggttta ggaagcaagt ttggttgcat 7440
caattaagca ggctcttttc aattgactga tgctggggcc ttcagtttta ttctcagtat 7500
agattgccag tattgttaag agtatccaaa ggcctttcta gatggagaca gaataactga 7560
cttgaacata cagtgtgcct gtaagtgtcc aggctcagag ctggtgaaaa cccttctgtt 7620
gggcgtgtgc agggttaaac tcctgaagta acttgtgagg acttcagtgc ttgctggtgt 7680
cctgggcagc accatgaatg cctttaccaa gacatgccaa gttggatccc ccgaatgaag 7740
cagatgtggc tgtggtgtga cccttgctcc ctgctacaca gagcatcgca gggctggcct 7800
gtgtggtttc cagatgaggg tctgggtccc ggaagcttgt gttgagagct cagtggaccc 7860
accccgcttg ctgaaccctc acagttcttg gggttgtcca gcctggactt gtagcacaca 7920
tgtcctgaag caaagctccg gtgactgcat gagccacctg gccacagtcc tcccatggag 7980
ggcctgccgt gacgctcagt ggagagggca gggcctgtgt ctccacttag gccacacagt 8040
gatgaggaaa ccacagatgg agcttcttgc cgataatact gactctagcc catgattgcc 8100
ttgcccaagc caaagaggaa ggttaggttg gcttgtcgag cccttgagcg ttgggagatg 8160
gggtgggaag gaggtgagcc cctgcagaga gttgggtagt gtccttcagg aatgaaagga 8220
ggggcaaagg agtcaccaga ggtcctgcat ttccatcagg gtttccacag tcatcagggc 8280
ttctctcttg agttgctgat aggagatgtg agttatgccc agagatgtct tatcgtgagg 8340
aaaaagaaac ttccttttgt tcacatttag gactctcagt gccatatgaa gtagcaaaag 8400
gcagtatcgg ccagatcagt gttacattga ttctaaaatt acagtgtccc cattagacaa 8460
ctattttagg tgctggagta tgtttgaaga gtgtgctggg aaaaaggaag catttcttca 8520
ttgatttaaa tcagtatgaa tattatatgc ctaaataaaa aatttgcaca ggtaaattct 8580
ctcacttgtg aatgggagaa gctgccccag gaatctgtga ggatggtatt ccctggagtc 8640
tggctttgaa agatttcatt gttggtagaa ataacaggtt gagaaagagg gagttagcat 8700
cacctaaaac ctgcacgtga acaagggttg acatgataca ctatggcctt agaaaagggc 8760
caggtgaaac cccaagctaa tcactgcggt ctttcagagc cggacagaca ggtgccagca 8820
gagcccgggg ctcactctcc tttcagtcat tcctcagccc ttcgaaggga agcccaaaca 8880
ctttgcacgc tgtgctgcag acattctggc ctggtgtgtc tgaaagttgc atcagtcctc 8940
acggtgcaaa cacagttgat ttaggaagtc acacaatgac actgaaatcc tacagaccaa 9000
aatccacttg tcagcaggag cagcagccca ggcccagcac cagcggtctt ccggctcctc 9060
tgagggctgc cacgttgggc gaggggagcc atgccaaggg tccaggctgc tttaggccat 9120
ctgtgcccca ctcatctggg gacagatggt ttttctttat tgtaaaattg tggactttta 9180
aaacctgttg actaaacagt aattaattta tatttgtgaa aaatgccact gtcctagtga 9240
tttctgatgt aaataatgtt gtttatatag tatgtattaa attttcctac attgtaaaac 9300
tgctgtactt ttgattcttg tatattaaaa agtgttactg agcattttta gaattgggct 9360
aacaaaaaaa aaaa 9374
<210> 76
<211> 986
<212> DNA
<213> 智人
<400> 76
aactagggcc cggagcccgg ggtgctggag ggaggcggca ggcccgggtc aggggcctcg 60
agatcgggct tgggcccaga gcatgttcca gatcccagag tttgagccga gtgagcagga 120
agactccagc tctgcagaga ggggcctggg ccccagcccc gcaggggacg ggccctcagg 180
ctccggcaag catcatcgcc aggccccagg cctcctgtgg gacgccagtc accagcagga 240
gcagccaacc agcagcagcc atcatggagg cgctggggct gtggagatcc ggagtcgcca 300
cagctcctac cccgcgggga cggaggacga cgaagggatg ggggaggagc ccagcccctt 360
tcggggccgc tcgcgctcgg cgccccccaa cctctgggca gcacagcgct atggccgcga 420
gctccggagg atgagtgacg agtttgtgga ctcctttaag aagggacttc ctcgcccgaa 480
gagcgcgggc acagcaacgc agatgcggca aagctccagc tggacgcgag tcttccagtc 540
ctggtgggat cggaacttgg gcaggggaag ctccgccccc tcccagtgac cttcgctcca 600
catcccgaaa ctccacccgt tcccactgcc ctgggcagcc atcttgaata tgggcggaag 660
tacttccctc aggcctatgc aaaaagagga tccgtgctgt ctcctttgga gggagggctg 720
acccagattc ccttccggtg cgtgtgaagc cacggaaggc ttggtcccat cggaagtttt 780
gggttttccg cccacagccg ccggaagtgg ctccgtggcc ccgccctcag gctccgggct 840
ttcccccagg cgcctgcgct aagtcgcgag ccaggtttaa ccgttgcgtc accgggaccc 900
gagcccccgc gatgccctgg gggccgtgct cactaccaaa tgttaataaa gcccgcgtct 960
gtgccgccga aaaaaaaaaa aaaaaa986
<210> 77
<211> 1732
<212> DNA
<213> 智人
<400> 77
tttacggcgc ggagccggag agacctgggc tggcgcgggc gggagctgcg gcggataccc 60
ttgcgtgctg tggagaccct actctcttcg ctgagaacgg ccgctagcgg ggactgaagg 120
ccgggagccc actcccgacc cggggctagc gtgcgtccct agagtcgagc ggggcaaggg 180
agccagtggc cgccgacggg ggaccgggaa acttttctgg gctcctgggc gcgccctgta 240
gccgcgctcc atgctccggc agcggcccga aacccagccc cgccgctgac ggcgcccgcc 300
gctccgggca gggcccatgc cctgcgcgct ccgggggtcg taggctgccg ccgagccggg 360
gctccggaag ccggcggggg cgccgcggcc gtgcggggcg tcaatggatc gccactccag 420
ctacatcttc atctggctgc agctggagct ctgcgccatg gccgtgctgc tcaccaaagg 480
tgaaattcga tgctactgtg atgctgccca ctgtgtagcc actggttata tgtgtaaatc 540
tgagctcagc gcctgcttct ctagacttct tgatcctcag aactcaaatt ccccactcac 600
ccatggctgc ctggactctc ttgcaagcac gacagacatc tgccaagcca aacaggcccg 660
aaaccactct ggcaccacca tacccacatt ggaatgctgt catgaagaca tgtgcaatta 720
cagagggctg cacgatgttc tctctcctcc caggggtgag gcctcaggac aaggaaacag 780
gtatcagcat gatggtagca gaaaccttat caccaaggtg caggagctga cttcttccaa 840
agagttgtgg ttccgggcag cggtcattgc cgtgcccatt gctggagggc tgattttagt 900
gttgcttatt atgttggccc tgaggatgct tcgaagtgaa aataagaggc tgcaggatca 960
gcggcaacag atgctctccc gtttgcacta cagctttcac ggacaccatt ccaaaaaggg 1020
gcaggttgca aagttagact tggaatgcat ggtgccggtc agtgggcacg agaactgctg 1080
tctgacctgt gataaaatga gacaagcaga cctcagcaac gataagatcc tctcgcttgt 1140
tcactggggc atgtacagtg ggcacgggaa gctggaattc gtatgacgga gtcttatctg 1200
aactacactt actgaacagc ttgaaggcct tttgagttct gctggacagg agcactttat 1260
ctgaagacaa actcatttaa tcatctttga gagacaaaat gacctctgca aacagaatct 1320
tggatatttc ttctgaagga ttatttgcac agacttaaat acagttaaat gtgttatttg 1380
cttttaaaat tataaaaagc aaagagaaga ctttgtacac actgtcacca gggttatttg 1440
catccaaggg agctggaatt gagtacctaa ataaacaaaa atgtgcccta tgtaagcttc 1500
tacatcttga tttattgtaa agatttaaaa gaaatatata tattttgtct gaaatttaat 1560
agtgtctttc ataaatttaa ctgggaaacg tgagacagta catgttaatt atacaaatgg 1620
ccatttgctg ttaataattt gttctcaact ctaggatgtg gcttggtttt tttttttctc 1680
ttttcttttt taaacaagac caagatcttg cttattcttc catgaaaaaa aa 1732
<210> 78
<211> 2427
<212> DNA
<213> 智人
<400> 78
agttctcgct ccgcccccca cttcttgctc gttccctccc atccccccaa gccagtagct 60
gtgctgcgca gctccctaag cggttgtcac cgctggagac ggttgggaga accgttgtgg 120
cgagcgctac acgaggcaaa cgacttctcc cttctttgaa ctggaccccg cgagcaccag 180
agtcggcgta actatcgcct gacaggcatt taaatcaaac ggtattgaga tggattgggt 240
tatgaaacat aatggtccaa atgacgctag tgatgggaca gtacgacttc gtggactacc 300
atttggttgc agcaaagagg aaatagttca gttctttcaa gggttggaaa tcgtgccaaa 360
tgggataaca ttgacgatgg actaccaggg gagaagcaca ggggaggcct tcgtgcagtt 420
tgcttcaaag gagatagcag aaaatgctct ggggaaacac aaggaaagaa tagggcacag 480
gtatattgag atcttcagaa gtagcaggag tgaaatcaaa ggattttatg atccaccaag 540
aagattgctg ggacagcgac cgggaccata tgatagacca ataggaggaa gagggggtta 600
ttatggagct gggcgtggaa gtatgtatga cagaatgcga cgaggaggtg atggatatga 660
tggtggttat ggaggttttg atgactatgg tggctataat aattacggct atgggaatga 720
tggctttgat gacagaatga gagatggaag aggtatggga ggacatggct atggtggagc 780
tggtgatgca agttcaggtt ttcatggtgg tcatttcgta catatgagag ggttgccttt 840
tcgtgcaact gaaaatgaca ttgctaattt cttctcacca ctaaatccaa tacgagttca 900
tattgatatt ggagctgatg gcagagccac aggagaagca gatgtagagt ttgtgacaca 960
tgaagatgca gtagctgcca tgtctaaaga taaaaataac atgcaacatc gatatattga 1020
actcttcttg aattctactc ctggaggcgg ctctggcatg ggaggttctg gaatgggagg 1080
ctacggaaga gatggaatgg ataatcaggg aggctatgga tcagttggaa gaatgggaat 1140
ggggaacaat tacagtggag gatatggtac tcctgatggt ttgggtggtt atggccgtgg 1200
tggtggaggc agtggaggtt actatgggca aggcggcatg agtggaggtg gatggcgtgg 1260
gatgtactga aagcaaaaac accaacatac aagtcttgac aacagcatct ggtctactag 1320
actttcttac agatttaatt tcttttgtat tttaagaact ttataatgac tgaaggaatg 1380
tgttttcaaa atattatttg gtaaagcaac agattgtgat gggaaaatgt tttctgtagg 1440
tttatttgtt gcatactttg acttaaaaat aaatttttat attcaaacca ctgatgttga 1500
tactttttat atactagtta ctcctaaaga tgtgctgcct tcataagatt tgggttgatg 1560
tattttacta ttagttctac aagaagtagt gtggtgtaat tttagaggat aatggttcac 1620
ctctgcgtaa actgcaagtc ttaagcagac atctggaata gagcttgaca aataattagt 1680
gtaacttttt tctttagttc ctcctggaca acactgtaaa tataaagcct aaagatgaag 1740
tggcttcagg agtataaatt cagctaatta tttctatatt attatttttc aaatgtcatt 1800
tatcaggcat agctctgaaa cattgatgat ctaagaggta ttgatttctg aatattcata 1860
attgtgttac ctgggtatga gagtgttgga agctgaattc tagccctaga ttttggagta 1920
aaaccccttc agcacttgac cgaaatacca aaaatgtctc caaaaaattg atagttgcag 1980
gttatcgcaa gatgtcttag agtagggtta aggttctcag tgacacaaga attcagtatt 2040
aagtacatag gtatttacta tggagtataa ttctcacaat tgtattttca gttttctgcc 2100
caatagagtt taaataactg tataaatgat gactttaaaa aaatgtaagc aacaagtcca 2160
tgtcatagtc aataaaaaca atcctgcagt tgggttttgt atctgatccc tgcttggagt 2220
tttagtttaa agaatctata tgtagcaagg aaaaggtgct ttttaatttt aatccctttg 2280
atcaatatgg cttttttcca aattggctaa tggatcaaaa tgaaacctgt tgatgtgaat 2340
tcagttattg aacttgttac ttgtttttgc cagaaatgtt attaataaat gtcattgtgg 2400
gagataatag taaaaaaaaa aaaaaaa 2427
<210> 79
<211> 2645
<212> DNA
<213> 智人
<400> 79
gggcgggcgc gcgggcgcgc gggcccgcgc aggcggtggc ggcggcggcg gaaccgagct 60
gacgggcgtg cggccgctgc gccgcaaact cgtgtgggac gcaccgctcc agccgcccgc 120
gggccagcgc accggtcccc cagcggcagc cgagcccgcc cgcgcgccgt tcgtgccctc 180
gtgaggctgg catgcaggat ggcaggacag cccggccaca tgccccatgg agggagttcc 240
aacaacctct gccacaccct ggggcctgtg catcctcctg acccacagag gcatcccaac 300
acgctgtctt ttcgctgctc gctggcggac ttccagatcg aaaagaagat aggccgagga 360
cagttcagcg aggtgtacaa ggccacctgc ctgctggaca ggaagacagt ggctctgaag 420
aaggtgcaga tctttgagat gatggacgcc aaggcgaggc aggactgtgt caaggagatc 480
ggcctcttga agcaactgaa ccacccaaat atcatcaagt atttggactc gtttatcgaa 540
gacaacgagc tgaacattgt gctggagttg gctgacgcag gggacctctc gcagatgatc 600
aagtacttta agaagcagaa gcggctcatc ccggagagga cagtatggaa gtactttgtg 660
cagctgtgca gcgccgtgga gcacatgcat tcacgccggg tgatgcaccg agacatcaag 720
cctgccaacg tgttcatcac agccacgggc gtcgtgaagc tcggtgacct tggtctgggc 780
cgcttcttca gctctgagac caccgcagcc cactccctag tggggacgcc ctactacatg 840
tcaccggaga ggatccatga gaacggctac aacttcaagt ccgacatctg gtccctgggc 900
tgtctgctgt acgagatggc agccctccag agccccttct atggagataa gatgaatctc 960
ttctccctgt gccagaagat cgagcagtgt gactaccccc cactccccgg ggagcactac 1020
tccgagaagt tacgagaact ggtcagcatg tgcatctgcc ctgaccccca ccagagacct 1080
gacatcggat acgtgcacca ggtggccaag cagatgcaca tctggatgtc cagcacctga 1140
gcgtggatgc accgtgcctt atcaaagcca gcaccacttt gccttacttg agtcgtcttc 1200
tcttcgagtg gccacctggt agcctagaac agctaagacc acagggttca gcaggttccc 1260
caaaaggctg cccagcctta cagcagatgc tgaaggcaga gcagctgagg gaggggcgct 1320
ggccacatgt cactgatggt cagattccaa agtcctttct ttatactgtt gtggacaatc 1380
tcagctgggt caataagggc aggtggttca gcgagccacg gcagccccct gtatctggat 1440
tgtaatgtga atctttaggg taattcctcc agtgacctgt caaggcttat gctaacagga 1500
gacttgcagg agaccgtgtg atttgtgtag tgagcctttg aaaatggtta gtaccgggtt 1560
cagtttagtt cttagtatct tttcaatcaa gctgtgtgct taatttactc tgttgtaaag 1620
ggataaagtg gaaatcattt ttttccgtgg agtggtgatt ctgctaacat ttttatctac 1680
gttttataac ttggtgagtg acgatgagag ccctgcacct ggccagagtg tcacaggcaa 1740
aaggcatcgg gaagcaggag catcttcttg gcagccaggc tgggccatct tctcctggac 1800
acctgctgtg taccaggaac ttcgtcacct ccttgaatgc tggcggttca tttcatgatc 1860
agtgttaagc attttcctcc atgggaagga agcatgggat atagaaaagc gaagggctgt 1920
cctttacaaa ttctggttct gcaacttcct agcgtgactt tgggcttggg caagtttctt 1980
agccgttctg agccttcatt tcctcatctg tacaatgaga ttaatagtac ctatcatcta 2040
ccttcaggat tgctgacaga cagaatttga aataaaatat gcaagttagc taatacaaaa 2100
agtagatgat ccaaaaatgg tagccactca cccttcacaa actgaagtcc atggaccacg 2160
gaagtcgaga attaatgtac acctgtatca tgtgtaggaa accagaaatg tgttccttat 2220
ttcttgttcc caaacaggat taactgtgaa gactaattta taaatgtgaa cctaagaaaa 2280
ctccacctct gaaggaaatc atttgaattt tgtttttgta cgtaaagtta accttccaat 2340
tgtctgagct gtcgtcactg acttcatgac agtctggccc tccagacaag agcagcgctg 2400
gcatcgggca ggtgattcct gacacctgct gcctgcaggc attcactgac caggcctttc 2460
ctggaggaaa cacccagggc cgggcggctg ctgtttccac acgtggactc ggatctgctg 2520
tgacaccgtc agcccgacag tctctccata tgcagccttt cctctgtact tttctccatg 2580
gttgaaataa aacagggtga ctgggagtta cttagaattc atgaagattt taaaaaaaaa 2640
aaaaa 2645
<210> 80
<211> 5184
<212> DNA
<213> 智人
<400> 80
gctttacact cgcgagcgga ccgccacacg ggtccggtgc ccgctgcgct tccgccccag 60
cgctcctgag gcggccgtac aatcctcggc agtgtcctga gactgtatgg tcagctcagc 120
ccggcctccg actccttccg actcccagca ttcgagccac tttttttttt ctttgaaaac 180
tcagaaaagt gactcctttt ccagggaaaa aggaacttgg gttcccttct ctccgtcctc 240
ttttcgggtc tgacagcctc cacccactcc ttccccggac cccgcctccg cgcgcaggtt 300
cctcccagtc acctttctcc acccccgccc ccgcacctag cccgccgcgc gccaccttcc 360
acctgactgc gcggggcgct cgggacctgc gcgcacctcg gaccttcacc acccgcccgg 420
gccgcgggga gcggacgagg gccacagccc cccacccgcc agggagccca ggtgctcggc 480
gtctgaacgt ctcaaagggc cacagcgaca atgacagctg acaaggagaa gaaaaggagt 540
agctcggaga ggaggaagga gaagtcccgg gatgctgcgc ggtgccggcg gagcaaggag 600
acggaggtgt tctatgagct ggcccatgag ctgcctctgc cccacagtgt gagctcccat 660
ctggacaagg cctccatcat gcgactggca atcagcttcc tgcgaacaca caagctcctc 720
tcctcagttt gctctgaaaa cgagtccgaa gccgaagctg accagcagat ggacaacttg 780
tacctgaaag ccttggaggg tttcattgcc gtggtgaccc aagatggcga catgatcttt 840
ctgtcagaaa acatcagcaa gttcatggga cttacacagg tggagctaac aggacatagt 900
atctttgact tcactcatcc ctgcgaccat gaggagattc gtgagaacct gagtctcaaa 960
aatggctctg gttttgggaa aaaaagcaaa gacatgtcca cagagcggga cttcttcatg 1020
aggatgaagt gcacggtcac caacagaggc cgtactgtca acctcaagtc agccacctgg 1080
aaggtcttgc actgcacggg ccaggtgaaa gtctacaaca actgccctcc tcacaatagt 1140
ctgtgtggct acaaggagcc cctgctgtcc tgcctcatca tcatgtgtga accaatccag 1200
cacccatccc acatggacat ccccctggat agcaagacct tcctgagccg ccacagcatg 1260
gacatgaagt tcacctactg tgatgacaga atcacagaac tgattggtta ccaccctgag 1320
gagctgcttg gccgctcagc ctatgaattc taccatgcgc tagactccga gaacatgacc 1380
aagagtcacc agaacttgtg caccaagggt caggtagtaa gtggccagta ccggatgctc 1440
gcaaagcatg ggggctacgt gtggctggag acccagggga cggtcatcta caaccctcgc 1500
aacctgcagc cccagtgcat catgtgtgtc aactacgtcc tgagtgagat tgagaagaat 1560
gacgtggtgt tctccatgga ccagactgaa tccctgttca agccccacct gatggccatg 1620
aacagcatct ttgatagcag tggcaagggg gctgtgtctg agaagagtaa cttcctattc 1680
accaagctaa aggaggagcc cgaggagctg gcccagctgg ctcccacccc aggagacgcc 1740
atcatctctc tggatttcgg gaatcagaac ttcgaggagt cctcagccta tggcaaggcc 1800
atcctgcccc cgagccagcc atgggccacg gagttgagga gccacagcac ccagagcgag 1860
gctgggagcc tgcctgcctt caccgtgccc caggcagctg ccccgggcag caccaccccc 1920
agtgccacca gcagcagcag cagctgctcc acgcccaata gccctgaaga ctattacaca 1980
tctttggata acgacctgaa gattgaagtg attgagaagc tcttcgccat ggacacagag 2040
gccaaggacc aatgcagtac ccagacggat ttcaatgagc tggacttgga gacactggca 2100
ccctatatcc ccatggacgg ggaagacttc cagctaagcc ccatctgccc cgaggagcgg 2160
ctcttggcgg agaacccaca gtccaccccc cagcactgct tcagtgccat gacaaacatc 2220
ttccagccac tggcccctgt agccccgcac agtcccttcc tcctggacaa gtttcagcag 2280
cagctggaga gcaagaagac agagcccgag caccggccca tgtcctccat cttctttgat 2340
gccggaagca aagcatccct gccaccgtgc tgtggccagg ccagcacccc tctctcttcc 2400
atggggggca gatccaatac ccagtggccc ccagatccac cattacattt tgggcccaca 2460
aagtgggccg tcggggatca gcgcacagag ttcttgggag cagcgccgtt ggggccccct 2520
gtctctccac cccatgtctc caccttcaag acaaggtctg caaagggttt tggggctcga 2580
ggcccagacg tgctgagtcc ggccatggta gccctctcca acaagctgaa gctgaagcga 2640
cagctggagt atgaagagca agccttccag gacctgagcg ggggggaccc acctggtggc 2700
agcacctcac atttgatgtg gaaacggatg aagaacctca ggggtgggag ctgccctttg 2760
atgccggaca agccactgag cgcaaatgta cccaatgata agttcaccca aaaccccatg 2820
aggggcctgg gccatcccct gagacatctg ccgctgccac agcctccatc tgccatcagt 2880
cccggggaga acagcaagag caggttcccc ccacagtgct acgccaccca gtaccaggac 2940
tacagcctgt cgtcagccca caaggtgtca ggcatggcaa gccggctgct cgggccctca 3000
tttgagtcct acctgctgcc cgaactgacc agatatgact gtgaggtgaa cgtgcccgtg 3060
ctgggaagct ccacgctcct gcaaggaggg gacctcctca gagccctgga ccaggccacc 3120
tgagccaggc cttctacctg ggcagcacct ctgccgacgc cgtcccacca gcttcactct 3180
ctccgtctgt ttttgcaact aggtatttct aacgccagca cactatttac aagatggact 3240
tacctggcag acttgcccag gtcaccaagc agtggccttt ttctgagatg ctcactttat 3300
tatccctatt tttaaagtac acaattgttt tacctgttct gaaatgttct taaattttgt 3360
aggatttttt tcctccccac cttcaatgac ttctaattta tattatccat aggtttctct 3420
ccctccttct ccttctcaca cacaactgtc catactaaca agtttggtgc atgtctgttc 3480
ttctgtaggg agaagcttta gcttcatttt actaaaaaga ttcctcgtta ttgttgttgc 3540
caaagagaaa caaaaatgat tttgctttcc aagcttggtt tgtggcgtct ccctcgcaga 3600
gcccttctcg tttctttttt aaactaatca ccatattgta aatttcaggg tttttttttt 3660
tttgtttaag ctgactcttt gctctaattt tggaaaaaaa gaaatgtgaa gggtcaactc 3720
caacgtatgt ggttatctgt gaaagttgca cagcgtggct tttcctaaac tggtgttttt 3780
cccccgcatt tggtggattt tttattatta ttcaaaaaca taactgagtt ttttaaaaga 3840
ggagaaaatt tatatctggg ttaagtgttt atcatatata tgggtacttt gtaatatcta 3900
aaaacttaga aacggaaatg gaatcctgct cacaaaatca ctttaagatc ttttcgaagc 3960
tgttaatttt tcttagtgtt gtggacactg cagacttgtc cagtgctccc acggcctgta 4020
cggacactgt ggaaggcctc cctctgtcgg ctttttgcca tctgtgatat gccataggtg 4080
tgacaatccg agcagtggag tcattcagcg ggagcactgc gcgctatccc ctcacattct 4140
ctatgtacta tgtatgtatg tattattatt attgctgcca agagggtctg atggcacgtt 4200
gtggggtcgg ggggtggggc ggggaagtgc tctaactttt cttaaggttt tgttgctagc 4260
ccttcaagtg cactgagcta tgtgactcgg atggtctttc acacggcaca tttggacatt 4320
tccagaacta ccatgagatg gtttagacgg gaattcatgc aaatgagggg tcaaaaatgg 4380
tatagtgacc ccgtccacgt cctccaagct cacgaccttg gagccccgtg gagctggact 4440
gaggaggagg ctgcacagcg ggagagcagc tggtccagac cagccctgca gcccccactc 4500
agccggcagc cagatggccc cgcaaggcct ccagggatgg cccctagcca caggccctgg 4560
ctgaggtctc tgggtcggtc agtgacatgt aggtaggaag cactgaaaat agtgttccca 4620
gagcactttg caactccctg ggtaagaggg acgacacctc tggtttttca ataccaatta 4680
catggaactt ttctgtaatg ggtacaatga agaagtttct aaaaacacac acaaagcaca 4740
ttgggccaac tatttagtaa gcccggatag acttattgcc aaaaacaaaa aatagctttc 4800
aaaagaaatt taagttctat gagaaattcc ttagtcatgg tgttgcgtaa atcatatttt 4860
agctgcacgg cattacccca cacagggtgg cagaacttga agggttactg acgtgtaaat 4920
gctggtattt gatttcctgt gtgtgttgcc ctggcattaa gggcatttta cccttgcagt 4980
tttactaaaa cactgaaaaa tattccaagc ttcatattaa ccctacctgt caacgtaacg 5040
atttcatgaa cgttattata ttgtcgaatt cctactgaca acattataac tgtatgggag 5100
cttaacttta taaggaaatg tattttgaca ctggtatctt attaaagtat tctgatccta 5160
ccactgaaaa aaaaaaaaaa aaaa5184
<210> 81
<211> 3838
<212> DNA
<213> 智人
<400> 81
agtctcgggc ggcggtgtcc ggcgcgcggg cggcctgctg ggcgggctga agggttagcg 60
gagcacgggc aaggcggaga gtgacggagt cggcgagccc ccgcggcgac aggtaccggc 120
gccatggcca cggagatggg gcggccggcc gcggcgcccc gggagccgaa cgccctcctt 180
ccaggttctc tacttaaaag acaatgacta ctgatgaagg tgccaagaac aatgaagaaa 240
gccccacagc cactgttgct gagcagggag aggatattac ctccaaaaaa gacaggggag 300
tattaaagat tgtcaaaaga gtggggaatg gtgaggaaac gccgatgatt ggagacaaag 360
tttatgtcca ttacaaagga aaattgtcaa atggaaagaa gtttgattcc agtcatgata 420
gaaatgaacc atttgtcttt agtcttggca aaggccaagt catcaaggca tgggacattg 480
gggtggctac catgaagaaa ggagagatat gccatttact gtgcaaacca gaatatgcat 540
atggctcggc tggcagtctc cctaaaattc cctcgaatgc aactctcttt tttgagattg 600
agctccttga tttcaaagga gaggatttat ttgaagatgg aggcattatc cggagaacca 660
aacggaaagg agagggatat tcaaatccaa acgaaggagc aacagtagaa atccacctgg 720
aaggccgctg tggtggaagg atgtttgact gcagagatgt ggcattcact gtgggcgaag 780
gagaagacca cgacattcca attggaattg acaaagctct ggagaaaatg cagcgggaag 840
aacaatgtat tttatatctt ggaccaagat atggttttgg agaggcaggg aagcctaaat 900
ttggcattga acctaatgct gagcttatat atgaagttac acttaagagc ttcgaaaagg 960
ccaaagaatc ctgggagatg gataccaaag aaaaattgga gcaggctgcc attgtcaaag 1020
agaagggaac cgtatacttc aagggaggca aatacatgca ggcggtgatt cagtatggga 1080
agatagtgtc ctggttagag atggaatatg gtttatcaga aaaggaatcg aaagcttctg 1140
aatcatttct ccttgctgcc tttctgaacc tggccatgtg ctacctgaag cttagagaat 1200
acaccaaagc tgttgaatgc tgtgacaagg cccttggact ggacagtgcc aatgagaaag 1260
gcttgtatag gaggggtgaa gcccagctgc tcatgaacga gtttgagtca gccaagggtg 1320
actttgagaa agtgctggaa gtaaaccccc agaataaggc tgcaagactg cagatctcca 1380
tgtgccagaa aaaggccaag gagcacaacg agcgggaccg caggatatac gccaacatgt 1440
tcaagaagtt tgcagagcag gatgccaagg aagaggccaa taaagcaatg ggcaagaaga 1500
cttcagaagg ggtcactaat gaaaaaggaa cagacagtca agcaatggaa gaagagaaac 1560
ctgagggcca cgtatgacgc cacgccaagg agggaagagt cccagtgaac tcggcccctc 1620
ctcaatgggc tttcccccaa ctcaggacag aacagtgttt aatgtaaagt ttgttatagt 1680
ctatgtgatt ctggaagcaa atggcaaaac cagtagcttc ccaaaaacag cccccctgct 1740
gctgcccgga gggttcactg aggggtggca cgggaccact ccaggtggaa caaacagaaa 1800
tgactgtggt gtggagggag tgagccagca gcttaagtcc agctcatttc agtttctatc 1860
aaccttcaag tatccaattc agggtccctg gagatcatcc taacaatgtg gggctgttag 1920
gttttacctt tgaactttca tagcactgca gaaaccttta aaaaaaaaat gcttcatgaa 1980
tttctccttt cctacagttg ggtagggtag gggaaggagg ataagctttt gttttttaaa 2040
tgactgaagt gctataaatg tagtctgttg catttttaac caacagaacc cacagtagag 2100
gggtctcatg tctccccagt tccacagcag tgtcacagac gtgaaagcca gaacctcaga 2160
ggccacttgc ttgctgactt agcctcctcc caaagtcccc ctcctcagcc agcctccttg 2220
tgagagtggc tttctaccac acacagcctg tccctggggg agtaattctg tcattcctaa 2280
aacacccttc agcaatgata atgagcagat gagagtttct ggattagctt ttcctatttt 2340
cgatgaagtt ctgagatact gaaatgtgaa aagagcaatc agaattgtgc tttttctccc 2400
ctcctctatt ccttttaggg aataatattc aatacacagt acttcctccc agcattgcta 2460
ctgctcagct tcttctttca ttctaatcct tgctattaag aatttaagac ttgtgcttac 2520
aatatttttg acctggagtg gatctattta catagtcatt taggatccat gcagcttttt 2580
ttgtcttttt aagattattg gctcataagc atatgtatac tggtttatgg aactttattt 2640
acactcctct atcatgcaaa aaaattttga ctttttagta ctaagcttaa tttttaaaaa 2700
caaaatctgt agggttgaca aataaatagt tgctcttcta cactaggggt ttcacctgca 2760
ggtttgacac gcagttgctc gcttttcctg ccctgtcaag cttctctgtt ctggcgtgag 2820
ttgtgaaaga gttgaagaca gcttcccatg ccggtacaca gccagtagcc taaatctcca 2880
gtacttgagc tgaccattga actagggcaa gtcttaaatg tgtacatgta gttgaatttc 2940
agtccttacg ggtaaacaga ttgagcatgg ctctctattc cctcagccta agaaacactc 3000
atgggaatgc atttggcaac ccaaggaacc atttgcttaa acctggaaca tctcaccttt 3060
ttaaatccta aaaaacactg gcagttatat tttaaattag tttttatttt tatgatggtt 3120
ttatcaaaag acttttatta ttagattggg acccccttca aacctaaaaa tcaagttatt 3180
tccttttata atacttttct tccccatgga acaaatggga tcaatttgtg agttttttcc 3240
tttaatgata actaaaatcc ctctaatttc tcatttatgc ttttgtcttt tttatgaaat 3300
atttctttta aaagccccag tctcacctac gaaatatgaa gagcaaaagc tgattttgct 3360
tacttgctaa actgttggga aagctctgta gagcatggtt ccagtgaggc caagattgaa 3420
atttgatact aaaaaggcca cctagctttt tgcagataac aaacaagaaa gctattccaa 3480
gactcagatg atgccagctg tctcccacgt gtgtattatg gttcaccagg gggaactggc 3540
aaaagtgtgt gtggggaggg gaagggtgtg tgagtggttc tgagcaaata actacagggt 3600
gcccattacc actcaagaag acacttcacg tattcttgta tcaaattcaa taatcttaaa 3660
caatttgtgt agaagtccac agacatcttt caaccacctt ttaggctgca tatggattgc 3720
caagtcagca tatgaggaat taaagacatt gtttttaaaa aaaaaaaatc atttagatgc 3780
acttttttgt gtgttcttta aataaatcca aaaaaaatgt gacttccaaa aaaaaaaa 3838
<210> 82
<211> 2207
<212> DNA
<213> 智人
<400> 82
cacttcctcc ccagacaggg gtagtgcgag gccgggcaca gccttcctgt gtggttttac 60
cgcccagaga gcgtcatgga cctggggaaa ccaatgaaaa gcgtgctggt ggtggctctc 120
cttgtcattt tccaggtatg cctgtgtcaa gatgaggtca cggacgatta catcggagac 180
aacaccacag tggactacac tttgttcgag tctttgtgct ccaagaagga cgtgcggaac 240
tttaaagcct ggttcctccc tatcatgtac tccatcattt gtttcgtggg cctactgggc 300
aatgggctgg tcgtgttgac ctatatctat ttcaagaggc tcaagaccat gaccgatacc 360
tacctgctca acctggcggt ggcagacatc ctcttcctcc tgacccttcc cttctgggcc 420
tacagcgcgg ccaagtcctg ggtcttcggt gtccactttt gcaagctcat ctttgccatc 480
tacaagatga gcttcttcag tggcatgctc ctacttcttt gcatcagcat tgaccgctac 540
gtggccatcg tccaggctgt ctcagctcac cgccaccgtg cccgcgtcct tctcatcagc 600
aagctgtcct gtgtgggcat ctggatacta gccacagtgc tctccatccc agagctcctg 660
tacagtgacc tccagaggag cagcagtgag caagcgatgc gatgctctct catcacagag 720
catgtggagg cctttatcac catccaggtg gcccagatgg tgatcggctt tctggtcccc 780
ctgctggcca tgagcttctg ttaccttgtc atcatccgca ccctgctcca ggcacgcaac 840
tttgagcgca acaaggccat caaggtgatc atcgctgtgg tcgtggtctt catagtcttc 900
cagctgccct acaatggggt ggtcctggcc cagacggtgg ccaacttcaa catcaccagt 960
agcacctgtg agctcagtaa gcaactcaac atcgcctacg acgtcaccta cagcctggcc 1020
tgcgtccgct gctgcgtcaa ccctttcttg tacgccttca tcggcgtcaa gttccgcaac 1080
gatctcttca agctcttcaa ggacctgggc tgcctcagcc aggagcagct ccggcagtgg 1140
tcttcctgtc ggcacatccg gcgctcctcc atgagtgtgg aggccgagac caccaccacc 1200
ttctccccat aggcgactct tctgcctgga ctagagggac ctctcccagg gtccctgggg 1260
tggggatagg gagcagatgc aatgactcag gacatccccc cgccaaaagc tgctcaggga 1320
aaagcagctc tcccctcaga gtgcaagccc ctgctccaga agatagcttc accccaatcc 1380
cagctacctc aaccaatgcc aaaaaaagac agggctgata agctaacacc agacagacaa 1440
cactgggaaa cagaggctat tgtcccctaa accaaaaact gaaagtgaaa gtccagaaac 1500
tgttcccacc tgctggagtg aaggggccaa ggagggtgag tgcaaggggc gtgggagtgg 1560
cctgaagagt cctctgaatg aaccttctgg cctcccacag actcaaatgc tcagaccagc 1620
tcttccgaaa accaggcctt atctccaaga ccagagatag tggggagact tcttggcttg 1680
gtgaggaaaa gcggacatca gctggtcaaa caaactctct gaacccctcc ctccatcgtt 1740
ttcttcactg tcctccaagc cagcgggaat ggcagctgcc acgccgccct aaaagcacac 1800
tcatcccctc acttgccgcg tcgccctccc aggctctcaa caggggagag tgtggtgttt 1860
cctgcaggcc aggccagctg cctccgcgtg atcaaagcca cactctgggc tccagagtgg 1920
ggatgacatg cactcagctc ttggctccac tgggatggga ggagaggaca agggaaatgt 1980
caggggcggg gagggtgaca gtggccgccc aaggcccacg agcttgttct ttgttctttg 2040
tcacagggac tgaaaacctc tcctcatgtt ctgctttcga ttcgttaaga gagcaacatt 2100
ttacccacac acagataaag ttttcccttg aggaaacaac agctttaaaa gaaaaagaaa 2160
aaaaaagtct ttggtaaatg gcaaaaaaaa aaaaaaaaaa aaaaaaa 2207
<210> 83
<211> 838
<212> DNA
<213> 智人
<400> 83
ctcgcgagat ttgacctctc gtccctgaga ggcgggtggg tgttagttca gagggttatg 60
ggagggctct ggcgtcctgg atggaggtgc gttcctttct gtggctggcg ctggatccac 120
cctgggtctc caaccagggc tgcagagagg gtagagccgt ttcttaggcc agagtggagt 180
gggacaggag gtgccgagag aggactgagg tggcttggga catggaagcg ctgcagcctt 240
cgagcccggc atccagcatt gcagccgccg cggcggccta agagctcgaa ccctttcaca 300
cgcgcgcagg aggaggagcg gcggcggcag aacaagacga ccctcactta cgtggccgct 360
gtcgccgtgg gcatgctggg ggcgtcctac gctgccgtac ccctttatcg gctctattgc 420
cagactactg gacttggagg atcagcagtt gcaggtcatg cctcagacaa gattgaaaac 480
atggtgcctg ttaaagatcg aatcattaaa attagcttta atgcagatgt gcatgcaagt 540
ctccagtgga actttagacc tcagcaaaca gaaatatatg tggtgccagg agagactgca 600
ctggcgtttt acagagctaa gaatcctact gacaaaccag taattggaat ttctacatac 660
aatattgttc catttgaagc tggacagtat ttcaataaaa tacaggtatt gtcttccagg 720
cttcaaagct gcacagagtc tacgttttag agagttggca cctttgatgt ggtagtgagc 780
tgatcatcca ctttcttcta aaataaagag aagaaaatgg ccagtaaaaa aaaaaaaa 838
<210> 84
<211> 586
<212> DNA
<213> 智人
<400> 84
aaacactctg tgtggctcct cggctttgac agagtgcaag acgatgactt gcaaaatgtc 60
gcagctggaa cgcaacatag agaccatcat caacaccttc caccaatact ctgtgaagct 120
ggggcaccca gacaccctga accaggggga attcaaagag ctggtgcgaa aagatctgca 180
aaattttctc aagaaggaga ataagaatga aaaggtcata gaacacatca tggaggacct 240
ggacacaaat gcagacaagc agctgagctt cgaggagttc atcatgctga tggcgaggct 300
aacctgggcc tcccacgaga agatgcacga gggtgacgag ggccctggcc accaccataa 360
gccaggcctc ggggagggca ccccctaaga ccacagtggc caagatcaca gtggccacgg 420
ccacggccac agtcatggtg gccacggcca cagccactaa tcaggaggcc aggccaccct 480
gcctctaccc aaccagggcc ccggggcctg ttatgtcaaa ctgtcttggc tgtggggcta 540
ggggctgggg ccaaataaag tctcttcctc caagtcaaaa aaaaaa586
<210> 85
<211> 1567
<212> DNA
<213> 智人
<400> 85
cgccccaccc gcgagccgca gccgcggccc cacagcttct ggggctgggg ccccggcagc 60
cgggcaggcc ggcctgacct cgacctccgc cgtgcgggcc cgaccggtga gtccagcccg 120
gcagtcgcag gacccggccg ccagcctctc cctccacctc tccctgcccc cagcgccagg 180
cgcgggctgc gctcggtggc ggcggcgggg ccctcaggcg gccatggcgg caggcgccgg 240
ggccgggtcc gcgccgcgct ggctgagggc gctgagcgag ccgctgagcg cggcgcagct 300
gcggcgactg gaggagcacc gctacagcgc ggcgggcgtc tcgctgctcg agccgccgct 360
gcagctctac tggacctggc tgctccagtg gatcccgctc tggatggccc ccaactccat 420
caccctgctg gggctcgccg tcaacgtggt caccacgctc gtgctcatct cctactgtcc 480
cacggccacc gaagaggcac catactggac atacctttta tgtgcactgg gactttttat 540
ttaccagtca ctggatgcta ttgatgggaa acaagccaga agaacaaact cttgttcccc 600
tttaggggag ctctttgacc atggctgtga ctctctttcc acagtattta tggcagtggg 660
agcttcaatt gccgctcgct taggaactta tcctgactgg ttttttttct gctcttttat 720
tgggatgttt gtgttttatt gcgctcattg gcagacttat gtttcaggca tgttgagatt 780
tggaaaagtg gatgtaactg aaattcagat agctttagtg attgtctttg tgttgtctgc 840
atttggagga gcaacaatgt gggactatac gattcctatt ctagaaataa aattgaagat 900
ccttccagtt cttggatttc taggtggagt aatattttcc tgttcaaatt atttccatgt 960
tatcctccat ggtggtgttg gcaagaatgg atccactata gcaggcacca gtgtcttgtc 1020
acctggactc cacataggac taattattat actggcaata atgatctata aaaagtcagc 1080
aactgatgtg tttgaaaagc atccttgtct ttatatccta atgtttggat gtgtctttgc 1140
taaagtctca caaaaattag tggtagctca catgaccaaa agtgaactat atcttcaaga 1200
cactgtcttt ttggggccag gtcttttgtt tttagaccag tactttaata actttataga 1260
cgaatatgtt gttctatgga tggcaatggt gatttcttca tttgatatgg tgatatactt 1320
tagtgctttg tgcctgcaaa tttcaagaca ccttcatcta aatatattca agactgcatg 1380
tcatcaagca cctgaacagg ttcaagttct ttcttcaaag agtcatcaga ataacatgga 1440
ttgaagagac ttccgaacac ttgctatctc ttgctgctgc tgtttcatgg aaggagatat 1500
taaacatttg tttaattttt atttaagtgt tatacctatt tcagcaaata aaatatttca 1560
ttgctta 1567
<210> 86
<211> 5208
<212> DNA
<213> 智人
<400> 86
cttactcatt tgtgtttatt cttggactta tcctgacata atggggtttt tttaattata 60
gattcacact gcatttattc atcacccctg tcctctcatc cataactcaa atttactacc 120
agcaacacaa aatacaaaga tgtgtccagt ttcactacag ctcttcgcgt ttacaagtgt 180
cgagcgcttg ctttcggaac gcccttgtga ttggccgagc caatgccagt gacatcaacc 240
aacttacttt tgattggaag gctggttgct gggactgtag cgtttgcagg aagtcactta 300
actgtttggg agctggaaaa ccgaagctga agttctcttt tgccatagga acgagcgcaa 360
ctgactagga aagatgtgtc ccaaagctcc gcaagctgga acgtgagcca ggaggcccgg 420
accggccacg ggaccgcgag gcactccgaa agtgtgcggc tgccccttcc ctgcctccca 480
gctgttaccc ttttaaatgt cagtgttcga ggctgtaggg gtagcacgag gcagcgaaac 540
ggaacagtcg gattggccgc acgcctcagt tctagacgca cctctccacc gaaggccgtt 600
ctgactggca gggggagaaa gtaaacagag ttgaatcacc ctccccactg gccaattgga 660
gggggtttgg tttgtgacgt gatgggattc tgcgaaattg ttactgagca agagaatgcc 720
ggaacggtgc ggaccggccg gagcaggggt tcagaagccg tcagtggact cgggaaaaag 780
tgtctcttag acctggcgct cggcgggacc ctcgccaccc gcgtcggggt gatcgggtga 840
atgtcctggg gctttggctc gacggcgagg cggccgaggg cgtgcacctc tcttgcagtt 900
tcctctccca gcgcctcggg ggcgttttca gtcgaataaa cttgcgaccg ccacgtgtgg 960
catctttcca agggagccgg ctcagagggg ccggcgcgcc cgtcggggga tcgcggccgg 1020
cgcggggcag gggcggcggc tagaggcggc ggcgcggcgg agcccggggc cgtggatgct 1080
gcgtgcggag gcgctgccgg ttacgtaaag atgaggggct gaggtcgcct cggcgctcct 1140
gcgagtcgga agcgccccgc gcccccgccc ccttggccgc cgcgccgtgc cgcgccgcgc 1200
cgcgctcgtc gtccgaggcc agggcagggc gagccgaacc tccgcagcca ccgccaagtt 1260
tgtccgcgcc gcctgggctg ccgtcgcccg caccatgtcc gcggccgcct acatggactt 1320
cgtggctgcc cagtgtctgg tttccatttc gaaccgcgct gcggtgccgg agcatggggt 1380
cgctccggac gccgagcggc tgcgactacc tgagcgcgag gtgaccaagg agcacggtga 1440
cccgggggac acctggaagg attactgcac actggtcacc atcgccaaga gcttgttgga 1500
cctgaacaag taccgaccca tccagacccc ctccgtgtgc agcgacagtc tggaaagtcc 1560
agatgaggat atgggatccg acagcgacgt gaccaccgaa tctgggtcga gtccttccca 1620
cagcccggag gagagacagg atcctggcag cgcgcccagc ccgctctccc tcctccatcc 1680
tggagtggct gcgaagggga aacacgcctc cgaaaagagg cacaagtgcc cctacagtgg 1740
ctgtgggaaa gtctatggaa aatcctccca tctcaaagcc cattacagag tgcatacagg 1800
tgaacggccc tttccctgca cgtggccaga ctgccttaaa aagttctccc gctcagacga 1860
gctgacccgc cactaccgga cccacactgg ggaaaagcag ttccgctgtc cgctgtgtga 1920
gaagcgcttc atgaggagtg accacctcac aaagcacgcc cggcggcaca ccgagttcca 1980
ccccagcatg atcaagcgat cgaaaaaggc gctggccaac gctttgtgag gtgctgcccg 2040
tggaagccag ggagggatgg accccgaaag gacaaaagta ctcccaggaa acagacgcgt 2100
gaaaactgag ccccagaaga ggcacacttg acggcacagg aagtcactgc tctttggtca 2160
atattctgat tttcctctcc ctgcattgtt tttaaaaagc acattgtagc ctaagatcaa 2220
agtcaacaac actcggtccc cttgaagagg caactctctg aacccgtctc tgactgttgg 2280
agggaaggca aatgcttttg ggttttttgg tttttgtttt tgtttttttt tctcctttta 2340
tttttttgcg ggggagggta gggagtgggt gggggggagg ggggtaaggc caagactggg 2400
gtagaatttt aaagattcaa cactggtgta catatgtccg ctgggtgagt tgacctgtgg 2460
cctcgcacag tgattctggg ccctttatgc ttgctgtctc tcagaattgt tttcttacct 2520
tttaatgtaa tgacgagtgt gcttcagttt gtttagcaaa accactctct tgaatcacgt 2580
taacttttga gattaaaaaa aaaaacgcca tagcacagct gtctttatgc aagcaagagc 2640
acatctactc cagcatgatc tgtcatctaa agacttgaaa acaaaaaaca gttacttata 2700
gtcaatgggt aagcagagtc tgaatttata ctaatcaaga caaacctttg aaaggttaca 2760
ctaagtacag aacttttaaa ccttgctttg tatgagttgt actttttgaa cataagctgc 2820
acttttattt tctaatgcag aggatgaata agttaaatac atgctttgag gatagaagca 2880
gatgttctgt ttggcaccac gttataatct gcttatttta caatatacac gtttccctaa 2940
gaaatcatgg cagagatgtg agggcagaat atacacaaca gatgctgaag gagaaggagg 3000
gtagtgtttt gcaaaagaaa aagaaaagaa ccaacagaat tttaactcta ttaacttttc 3060
caaattttcc tatgctttta gttaacatca ttattgtatc ctaatgccac taggggagag 3120
agcttttgac tctgttgggt tttatttgaa tgtgtgcata acagtaatga gatctggaaa 3180
cacctatttt ttggggaaaa aggtttgttg gtctccttcc tgtgttccta caaaactccc 3240
actctcaggt gcaagagtta tgtagaagga aagggagctg aaataggaac agaaaaatca 3300
acccctataa ctagtgaaca ccaagggaaa ataccacaat gatttcagag gagactctgc 3360
aaaatcgtcc cttgtggaga atgcaggcaa catggaatac taggaatgaa atcacatcac 3420
tgtatctttt acatcaatag cctcaccact aatatatctt gtatctaggt gtctataatg 3480
gctgaaacca ctacatccat ctatgccatt tacctgaaaa cttaactgtg gcctttatga 3540
ggccagaaaa gtgaactgag ttttcgtagt taagacctca aatgagggga gtcagcagtg 3600
atcatggggg aaatgtttac attttttttt tcttcagaag taacgctttc tgatgatttt 3660
atctgatatt taaaacaggg agctatggtg cactctagtt tatacttgcg ctctgaaatg 3720
tgtaaacata gggtgcctac ctatttcacc tgacccatac tcgtttctga ttcagaatca 3780
gtgtgggctc ctgcagtggg cgcgggtcac ggctgactcc aacttccaat acaacagcca 3840
tcactagcac agtgtttttt tgtttaacca acgtagttgt attagtagtt ctataaagag 3900
aactgctttt aacattaggg actgggagca gtccatggga taaaaaggaa agtgttttct 3960
cacgagaaaa catgtcagga aaaataaaga acactttcta cctctgtttc agatttttga 4020
aacacttatt ttaaaccaaa ttttaatttc tgtgtccaaa ataagtttta aggacatctg 4080
ttcttccata cgaaataggt taggctgcct atttctcact gagctcatgg aatggttctg 4140
cttatgatac tctgcacgct gccttttagt gagtgaggag tttggggttg cctagcaact 4200
tgctaacttg taaaaagtca tctttccctc acagaaagaa acgaaagaaa gcaaagcaaa 4260
gtcagtgaaa gacaatcttt atagtttcag gagtaaatct aaatgtggct tttgtcaagc 4320
acttagatgg atataaatgc agcaacttgt tttaaaaaaa tgcacaattt acttcccaaa 4380
aaagttgtta cttgcctttt caagttgttg acaaacacac atttgatatt ctcttatatg 4440
ttatagtaat gtaacgtata aactcaagcc tttttattct ttgtgattaa atcctgtttt 4500
aaaatgtcac aaaacaggaa ccagcattct aattagattt actatatcaa gatatggttc 4560
aaataggact actagagttc attgaacact aaaactatga aacaattact ttttatatta 4620
aaaagaccat ggatttaact tatgaaaatc caaatgcagg atagtaattt ttgtttactt 4680
ttttaaccaa actgaatttt tgaaagacta ttgcaggtgt ttaaaaagaa agaaaagttg 4740
ttttatctaa tactgtaagt agttgtcata ttctggaaaa tttaatagtt ttagagttaa 4800
gatatctcct ctctttggtt agggaagaag aaagcccttc accattgtgg aatgatgccc 4860
tggctttaag gtttagctcc acatcatgct tctcttgaga attctatttg gtagttacaa 4920
ttacagaaac tgattagttt gtcagtttgc agatagattt agcacagtac tcatcactcg 4980
gatagattga gatgttcttt cacatcagat gatctgtaac actgtaagat actgatcttt 5040
acaactgttt aatcagtttt atttttgtac agtattagtg acctaagtta ttttgctgtc 5100
ccgtttttgt aaatcaaatg aaattataaa agaggattct gacagtaggt attttgtaca 5160
tatgtatata tgttgtccaa ataaaaataa taaatgataa agactgaa5208
<210> 87
<211> 2535
<212> DNA
<213> 智人
<400> 87
gcactgcctc tggcacctgg ggcagccgcg cccgcggagt tttccgcccg gcgctgacgg 60
ctgctgcgcc cgcggctccc cagtgccccg agtgccccgc gggccccgcg agcgggagtg 120
ggacccagcc cctaggcaga acccaggcgc cgcgcccggg acgcccgcgg agagagccac 180
tcccgcccac gtcccatttc gcccctcgcg tccggagtcc ccgtggccag gtgtgtgtct 240
ggggaagaga cttacagaag tggagttgct gagtcaaaga tctaaccatg agctaccctg 300
gctatccccc gcccccaggt ggctacccac cagctgcacc aggtggtggt ccctggggag 360
gtgctgccta ccctcctccg cccagcatgc cccccatcgg gctggataac gtggccacct 420
atgcggggca gttcaaccag gactatctct cgggaatggc ggccaacatg tctgggacat 480
ttggaggagc caacatgccc aacctgtacc ctggggcccc tggggctggc tacccaccag 540
tgccccctgg cggctttggg cagcccccct ctgcccagca gcctgttcct ccctatggga 600
tgtatccacc cccaggagga aacccaccct ccaggatgcc ctcatatccg ccatacccag 660
gggcccctgt gccgggccag cccatgccac cccccggaca gcagccccca ggggcctacc 720
ctgggcagcc accagtgacc taccctggtc agcctccagt gccactccct gggcagcagc 780
agccagtgcc gagctaccca ggatacccgg ggtctgggac tgtcaccccc gctgtgcccc 840
caacccagtt tggaagccga ggcaccatca ctgatgctcc cggctttgac cccctgcgag 900
atgccgaggt cctgcggaag gccatgaaag gcttcgggac ggatgagcag gccatcattg 960
actgcctggg gagtcgctcc aacaagcagc ggcagcagat cctactttcc ttcaagacgg 1020
cttacggcaa ggatttgatc aaagatctga aatctgaact gtcaggaaac tttgagaaga 1080
caatcttggc tctgatgaag accccagtcc tctttgacat ttatgagata aaggaagcca 1140
tcaagggggt tggcactgat gaagcctgcc tgattgagat cctcgcttcc cgcagcaatg 1200
agcacatccg agaattaaac agagcctaca aagcagaatt caaaaagacc ctggaagagg 1260
ccattcgaag cgacacatca gggcacttcc agcggctcct catctctctc tctcagggaa 1320
accgtgatga aagcacaaac gtggacatgt cactcgccca gagagatgcc caggagctgt 1380
atgcggccgg ggagaaccgc ctgggaacag acgagtccaa gttcaatgcg gttctgtgct 1440
cccggagccg ggcccacctg gtagcagttt tcaatgagta ccagagaatg acaggccggg 1500
acattgagaa gagcatctgc cgggagatgt ccggggacct ggaggagggc atgctggccg 1560
tggtgaaatg tctcaagaat accccagcct tctttgcgga gaggctcaac aaggccatga 1620
ggggggcagg aacaaaggac cggaccctga ttcgcatcat ggtgtctcgc agcgagaccg 1680
acctcctgga catcagatca gagtataagc ggatgtacgg caagtcgctg taccacgaca 1740
tctcgggaga tacttcaggg gattaccgga agattctgct gaagatctgt ggtggcaatg 1800
actgaacagt gactggtggc tcacttctgc ccacctgccg gcaacaccag tgccaggaaa 1860
aggccaaaag aatgtctgtt tctaacaaat ccacaaatag ccccgagatt caccgtccta 1920
gagcttaggc ctgtcttcca cccctcctga cccgtatagt gtgccacagg acctgggtcg 1980
gtctagaact ctctcaggat gccttttcta ccccatccct cacagcctct tgctgctaaa 2040
atagatgttt catttttctg actcatgcaa tcattcccct ttgcctgtgg ctaagacttg 2100
gcttcatttc gtcatgtaat tgtatatttt tatttggagg catattttct tttcttacag 2160
tcattgccag acagaggcat acaagtctgt ttgctgcata cacatttctg gtgagggcga 2220
ctgggtgggt gaagcaccgt gtcctcgctg aggagagaaa gggaggcgtg cctgagaagg 2280
tagcctgtgc atctggtgag tgtgtcacga gctttgttac tgccaaactc actccttttt 2340
agaaaaaaca aaaaaaaagg gccagaaagt cattccttcc atcttccttg cagaaaccac 2400
gagaacaaag ccagttccct gtcagtgaca gggcttcttg taatttgtgg tatgtgcctt 2460
aaacctgaat gtctgtagcc aaaacttgtt tccacattaa gagtcagcca gctctggaat 2520
ggtctggaaa tgtca2535
<210> 88
<211> 7080
<212> DNA
<213> 智人
<400> 88
gagctagcgc tcaagcagag cccagcgcgg tgctatcgga cagagcctgg cgagcgcaag 60
cggcgcgggg agccagcggg gctgagcgcg gccagggtct gaacccagat ttcccagact 120
agctaccact ccgcttgccc acgccccggg agctcgcggc gcctggcggt cagcgaccag 180
acgtccgggg ccgctgcgct cctggcccgc gaggcgtgac actgtctcgg ctacagaccc 240
agagggagca cactgccagg atgggagctg ctgggaggca ggacttcctc ttcaaggcca 300
tgctgaccat cagctggctc actctgacct gcttccctgg ggccacatcc acagtggctg 360
ctgggtgccc tgaccagagc cctgagttgc aaccctggaa ccctggccat gaccaagacc 420
accatgtgca tatcggccag ggcaagacac tgctgctcac ctcttctgcc acggtctatt 480
ccatccacat ctcagaggga ggcaagctgg tcattaaaga ccacgacgag ccgattgttt 540
tgcgaacccg gcacatcctg attgacaacg gaggagagct gcatgctggg agtgccctct 600
gccctttcca gggcaatttc accatcattt tgtatggaag ggctgatgaa ggtattcagc 660
cggatcctta ctatggtctg aagtacattg gggttggtaa aggaggcgct cttgagttgc 720
atggacagaa aaagctctcc tggacatttc tgaacaagac ccttcaccca ggtggcatgg 780
cagaaggagg ctattttttt gaaaggagct ggggccaccg tggagttatt gttcatgtca 840
tcgaccccaa atcaggcaca gtcatccatt ctgaccggtt tgacacctat agatccaaga 900
aagagagtga acgtctggtc cagtatttga acgcggtgcc cgatggcagg atcctttctg 960
ttgcagtgaa tgatgaaggt tctcgaaatc tggatgacat ggccaggaag gcgatgacca 1020
aattgggaag caaacacttc ctgcaccttg gatttagaca cccttggagt tttctaactg 1080
tgaaaggaaa tccatcatct tcagtggaag accatattga atatcatgga catcgaggct 1140
ctgctgctgc ccgggtattc aaattgttcc agacagagca tggcgaatat ttcaatgttt 1200
ctttgtccag tgagtgggtt caagacgtgg agtggacgga gtggttcgat catgataaag 1260
tatctcagac taaaggtggg gagaaaattt cagacctctg gaaagctcac ccaggaaaaa 1320
tatgcaatcg tcccattgat atacaggcca ctacaatgga tggagttaac ctcagcaccg 1380
aggttgtcta caaaaaaggc caggattata ggtttgcttg ctacgaccgg ggcagagcct 1440
gccggagcta ccgtgtacgg ttcctctgtg ggaagcctgt gaggcccaaa ctcacagtca 1500
ccattgacac caatgtgaac agcaccattc tgaacttgga ggataatgta cagtcatgga 1560
aacctggaga taccctggtc attgccagta ctgattactc catgtaccag gcagaagagt 1620
tccaggtgct tccctgcaga tcctgcgccc ccaaccaggt caaagtggca gggaaaccaa 1680
tgtacctgca catcggggag gagatagacg gcgtggacat gcgggcggag gttgggcttc 1740
tgagccggaa catcatagtg atgggggaga tggaggacaa atgctacccc tacagaaacc 1800
acatctgcaa tttctttgac ttcgatacct ttgggggcca catcaagttt gctctgggat 1860
ttaaggcagc acacttggag ggcacggagc tgaagcatat gggacagcag ctggtgggtc 1920
agtacccgat tcacttccac ctggccggtg atgtagacga aaggggaggt tatgacccac 1980
ccacatacat cagggacctc tccatccatc atacattctc tcgctgcgtc acagtccatg 2040
gctccaatgg cttgttgatc aaggacgttg tgggctataa ctctttgggc cactgcttct 2100
tcacggaaga tgggccggag gaacgcaaca cttttgacca ctgtcttggc ctccttgtca 2160
agtctggaac cctcctcccc tcggaccgtg acagcaagat gtgcaagatg atcacagagg 2220
actcctaccc ggggtacatc cccaagccca ggcaagactg caatgctgtg tccaccttct 2280
ggatggccaa tcccaacaac aacctcatca actgtgccgc tgcaggatct gaggaaactg 2340
gattttggtt tatttttcac cacgtaccaa cgggcccctc cgtgggaatg tactccccag 2400
gttattcaga gcacattcca ctgggaaaat tctataacaa ccgagcacat tccaactacc 2460
gggctggcat gatcatagac aacggagtca aaaccaccga ggcctctgcc aaggacaagc 2520
ggccgttcct ctcaatcatc tctgccagat acagccctca ccaggacgcc gacccgctga 2580
agccccggga gccggccatc atcagacact tcattgccta caagaaccag gaccacgggg 2640
cctggctgcg cggcggggat gtgtggctgg acagctgccg gtttgctgac aatggcattg 2700
gcctgaccct ggccagtggt ggaaccttcc cgtatgacga cggctccaag caagagataa 2760
agaacagctt gtttgttggc gagagtggca acgtggggac ggaaatgatg gacaatagga 2820
tctggggccc tggcggcttg gaccatagcg gaaggaccct ccctataggc cagaattttc 2880
caattagagg aattcagtta tatgatggcc ccatcaacat ccaaaactgc actttccgaa 2940
agtttgtggc cctggagggc cggcacacca gcgccctggc cttccgcctg aataatgcct 3000
ggcagagctg cccccataac aacgtgaccg gcattgcctt tgaggacgtt ccgattactt 3060
ccagagtgtt cttcggagag cctgggccct ggttcaacca gctggacatg gatggggata 3120
agacatctgt gttccatgac gtcgacggct ccgtgtccga gtaccctggc tcctacctca 3180
cgaagaatga caactggctg gtccggcacc cagactgcat caatgttccc gactggagag 3240
gggccatttg cagtgggtgc tatgcacaga tgtacattca agcctacaag accagtaacc 3300
tgcgaatgaa gatcatcaag aatgacttcc ccagccaccc tctttacctg gagggggcgc 3360
tcaccaggag cacccattac cagcaatacc aaccggttgt caccctgcag aagggctaca 3420
ccatccactg ggaccagacg gcccccgccg aactcgccat ctggctcatc aacttcaaca 3480
agggcgactg gatccgagtg gggctctgct acccgcgagg caccacattc tccatcctct 3540
cggatgttca caatcgcctg ctgaagcaaa cgtccaagac gggcgtcttc gtgaggacct 3600
tgcagatgga caaagtggag cagagctacc ctggcaggag ccactactac tgggacgagg 3660
actcagggct gttgttcctg aagctgaaag ctcagaacga gagagagaag tttgctttct 3720
gctccatgaa aggctgtgag aggataaaga ttaaagctct gattccaaag aacgcaggcg 3780
tcagtgactg cacagccaca gcttacccca agttcaccga gagggctgtc gtagacgtgc 3840
cgatgcccaa gaagctcttt ggttctcagc tgaaaacaaa ggaccatttc ttggaggtga 3900
agatggagag ttccaagcag cacttcttcc acctctggaa cgacttcgct tacattgaag 3960
tggatgggaa gaagtacccc agttcggagg atggcatcca ggtggtggtg attgacggga 4020
accaagggcg cgtggtgagc cacacgagct tcaggaactc cattctgcaa ggcataccat 4080
ggcagctttt caactatgtg gcgaccatcc ctgacaattc catagtgctt atggcatcaa 4140
agggaagata cgtctccaga ggcccatgga ccagagtgct ggaaaagctt ggggcagaca 4200
ggggtctcaa gttgaaagag caaatggcat tcgttggctt caaaggcagc ttccggccca 4260
tctgggtgac actggacact gaggatcaca aagccaaaat cttccaagtt gtgcccatcc 4320
ctgtggtgaa gaagaagaag ttgtgaggac agctgccgcc cggtgccacc tcgtggtaga 4380
ctatgacggt gactcttggc agcagaccag tgggggatgg ctgggtcccc cagcccctgc 4440
cagcagctgc ctgggaaggc cgtgtttcag ccctgatggg ccaagggaag gctatcagag 4500
accctggtgc tgccacctgc ccctactcaa gtgtctacct ggagcccctg gggcggtgct 4560
ggccaatgct ggaaacattc actttcctgc agcctcttgg gtgcttctct cctatctgtg 4620
cctcttcagt gggggtttgg ggaccatatc aggagacctg ggttgtgctg acagcaaaga 4680
tccactttgg caggagccct gacccagcta ggaggtagtc tggagggctg gtcattcaca 4740
gatccccatg gtcttcagca gacaagtgag ggtggtaaat gtaggagaaa gagccttggc 4800
cttaaggaaa tctttactcc tgtaagcaag agccaacctc acaggattag gagctggggt 4860
agaactggct atccttgggg aagaggcaag ccctgcctct ggccgtgtcc acctttcagg 4920
agactttgag tggcaggttt ggacttggac tagatgactc tcaaaggccc ttttagttct 4980
gagattccag aaatctgctg catttcacat ggtacctgga acccaacagt tcatggatat 5040
ccactgatat ccatgatgct gggtgcccca gcgcacacgg gatggagagg tgagaactaa 5100
tgcctagctt gaggggtctg cagtccagta gggcaggcag tcaggtccat gtgcactgca 5160
atgccaggtg gagaaatcac agagaggtaa aatggaggcc agtgccattt cagaggggag 5220
gctcaggaag gcttcttgct tacaggaatg aaggctgggg gcattttgct ggggggagat 5280
gaggcagcct ctggaatggc tcagggattc agccctccct gccgctgcct gctgaagctg 5340
gtgactacgg ggtcgccctt tgctcacgtc tctctggccc actcatgatg gagaagtgtg 5400
gtcagagggg agcaatgggc tttgctgctt atgagcacag aggaattcag tccccaggca 5460
gccctgcctc tgactccaag agggtgaagt ccacagaagt gagctcctgc cttagggcct 5520
catttgctct tcatccaggg aactgagcac agggggcctc caggagaccc tagatgtgct 5580
cgtactccct cggcctggga tttcagagct ggaaatatag aaaatatcta gcccaaagcc 5640
ttcattttaa cagatgggga aagtgagccc ccaagatggg aaagaaccac acagctaagg 5700
gagggcctgg ggagccccac cctagccctt gctgccacac cacattgcct caacaaccgg 5760
ccccagagtg cccaggcact cctgaggtag cttctggaaa tggggacaag tcccctcgaa 5820
ggaaaggaaa tgactagagt agaatgacag ctagcagatc tcttccctcc tgctcccagc 5880
gcacacaaac ccgccctccc cttggtgttg gcggtccctg tggccttcac tttgttcact 5940
acctgtcagc ccagcctggg tgcacagtag ctgcaactcc ccattggtgc tacctggctc 6000
tcctgtctct gcagctctac aggtgaggcc cagcagaggg agtagggctc gccatgtttc 6060
tggtgagcca atttggctga tcttgggtgt ctgaacagct attgggtcca ccccagtccc 6120
tttcagctgc tgcttaatgc cctgctctct ccctggccca ccttatagag agcccaaaga 6180
gctcctgtaa gagggagaac tctatctgtg gtttataatc ttgcacgagg caccagagtc 6240
tccctgggtc ttgtgatgaa ctacatttat cccctttcct gccccaacca caaactcttt 6300
ccttcaaaga gggcctgcct ggctccctcc acccaactgc acccatgaga ctcggtccaa 6360
gagtccattc cccaggtggg agccaactgt cagggaggtc tttcccacca aacatctttc 6420
agctgctggg aggtgaccat agggctctgc ttttaaagat atggctgctt caaaggccag 6480
agtcacagga aggacttctt ccagggagat tagtggtgat ggagaggaga gttaaaatga 6540
cctcatgtcc ttcttgtcca cggttttgtt gagttttcac tcttctaatg caagggtctc 6600
acactgtgaa ccacttagga tgtgatcact ttcaggtggc caggaatgtt gaatgtcttt 6660
ggctcagttc atttaaaaaa gatatctatt tgaaagttct cagagttgta catatgtttc 6720
acagtacagg atctgtacat aaaagtttct ttcctaaacc attcaccaag agccaatatc 6780
taggcatttt cttggtagca caaattttct tattgcttag aaaattgtcc tccttgttat 6840
ttctgtttgt aagacttaag tgagttaggt ctttaaggaa agcaacgctc ctctgaaatg 6900
cttgtctttt ttctgttgcc gaaatagctg gtcctttttc gggagttaga tgtatagagt 6960
gtttgtatgt aaacatttct tgtaggcatc accatgaaca aagatatatt ttctatttat 7020
ttattatatg tgcacttcaa gaagtcactg tcagagaaat aaagaattgt cttaaatgtc 7080
<210> 89
<211> 1515
<212> DNA
<213> 智人
<400> 89
ggctcgggag agaccttgga gcgcgcggga aagagaccaa tataaactgt ggcgggatag 60
ttttcgggtc cttgtccagt gaaacaccct cggctgggaa gtcagttcgt tctctcctct 120
cctctcttct tgtttgaaca tggtgcggac taaagcagac agtgttccag gcacttacag 180
aaaagtggtg gctgctcgag cccccagaaa ggtgcttggt tcttccacct ctgccactaa 240
ttcgacatca gtttcatcga ggaaagctga aaataaatat gcaggaggga accccgtttg 300
cgtgcgccca actcccaagt ggcaaaaagg aattggagaa ttctttaggt tgtcccctaa 360
agattctgaa aaagagaatc agattcctga agaggcagga agcagtggct taggaaaagc 420
aaagagaaaa gcatgtcctt tgcaacctga tcacacaaat gatgaaaaag aatagaactt 480
tctcattcat ctttgaataa cgtctccttg tttaccctgg tattctagaa tgtaaattta 540
cataaatgtg tttgttccaa ttagctttgt tgaacaggca tttaattaaa aaatttaggt 600
ttaaatttag atgttcaaaa gtagttgtga aatttgagaa tttgtaagac taattatggt 660
aacttagctt agtattcaat ataatgcatt gtttggtttc ttttaccaaa ttaagtgtct 720
agttcttgct aaaatcaagt cattgcattg tgttctaatt acaagtatgt tgtatttgag 780
atttgcttag attgttgtac tgctgccatt tttattggtg tttgattatt ggaatggtgc 840
catattgtca ctccttctac ttgctttaaa aagcagagtt agatttttgc acattaaaaa 900
attcagtatt aattaaacat tacttattct accctctttt ttggcaagga ggacaaatac 960
gcaatgttgg aaaaccttgg atggatatct tctctttaaa aaaatgtaaa gataatttgg 1020
tcttgagggt ttaaacggtt gataatgcct ctacaacaac aagaaaaaag ataaaatact 1080
aggatagaat catggtgggc acagtggctt ctcaggaggc tgaggaggga ggtttgcttg 1140
agtccaggag ttggagacca gcccaggcaa catagcgtaa accctatctc taaaacaatt 1200
tttagccggg tgcggtggct cacgcctgta atcccagcac tctgggaggc cgaggcgggt 1260
ggatcatgag gtcaggagat cgagaccatc ctgcctaaca aggtgaaacc ccgtctctac 1320
taaaaataca aaaaattagc cgggcgcggt ggcgggcgcc tgtagtccca gctactcggg 1380
aggctgaggc aggagaatgg cgtgaacccg ggaagtggag cttgcagtga gccgagattg 1440
cgccactgca gtcggcagtc cggcttgggc gacagagcga gactccgtct caaaaaaaaa 1500
aaaaaaaaaa aaaaa1515
<210> 90
<211> 1774
<212> DNA
<213> 智人
<400> 90
agtactgaaa ttaagcagca tccaacacag gcctactctt acgacatgtg actttactgt 60
tttccgtttt tgttgaaaga gtcattaaca gttaggagtt gatggcagtt tcaataacag 120
gtcattgccg agaaaaggat agcactataa tatgcagaaa tctacaaatt ctgatacttc 180
cgtggaaaca ctgaattcta cccgccaagg cacaggagct gtgcaaatga gaatcaaaaa 240
tgccaacagc caccatgaca ggctcagcca aagtaaatcc atgatcctca ccgatgtcgg 300
gaaggtcact gaacctatat ccagacacag aaggaatcat tcacagcata tcttgaaaga 360
tgtcattcct ccattggaac aactgatggt tgaaaaagaa ggttatctgc aaaaagctaa 420
aattgcagat ggaggaaaga aactaaggaa aaactggtct acttcctgga ttgttctttc 480
tagtcgaaga attgaatttt acaaagaatc caagcaacag gctctgtcca atatgaaaac 540
tgggcacaaa ccagaaagtg tggatttgtg tggagcacac attgaatggg ccaaggaaaa 600
atcgagcaga aagaatgtct ttcagatcac aacagtatca ggaaatgagt tccttctaca 660
gtcagatatt gacttcatca tattggattg gttccacgct atcaaaaatg caattgacag 720
attgccaaag gattcaagtt gtccatcaag aaacctggaa ttattcaaaa tccaaagatc 780
ctctagcact gaattgctaa gtcactacga cagtgatata aaagaacaga aaccagagca 840
cagaaaatct ttaatgttca gactgcatca cagtgcttcc gatacaagcg acaaaaatcg 900
agttaaaagc agattaaaga agtttattac ccgaagacct tccctgaaaa ctctgcaaga 960
aaaaggactt attaaagatc aaatttttgg ctctcatctg cacaaagtgt gtgaacgtga 1020
aaattccaca gttccgtggt ttgtaaagca atgcattgaa gctgttgaga aaagaggtct 1080
agatgttgat ggaatatatc gagttagtgg caatctggca acaatacaga agttaagatt 1140
tattgtcaac caagaagaga agctgaattt ggacgacagc cagtgggagg acatccacgt 1200
tgtcaccgga gcactgaaga tgtttttccg ggagctgcct gagccgctct tcccttacag 1260
tttctttgag cagtttgtgg aagcgatcaa aaagcaagac aacaacacaa gaattgaagc 1320
tgtaaaatct cttgtacaaa aactccctcc gccaaatcgt gacaccatga aagtcctctt 1380
tggacatcta actaagatag tggccaaagc ctccaagaac ctcatgtcca cgcaaagctt 1440
ggggattgta tttggaccta cccttctgcg agctgaaaat gaaacaggaa acatggcgat 1500
ccacatggtc taccagaacc agatagctga gctcatgctg agtgagtaca gtaagatctt 1560
cggctcagag gaagactgac agacaagaca agctactgaa tacgttcaca tctgtcttga 1620
tgcctaatat ttttacattt ctgtaaacat atttctgaaa tattttttgc ctttcaagcg 1680
acagatgcct cattttgtga aaacttaatg atgattttgt gtttaagttc caaacatttg 1740
aataaaataa ttgacaataa aaaaaaaaaa aaaa 1774
<210> 91
<211> 2707
<212> DNA
<213> 智人
<400> 91
gtatgctgct gctgccgggt gtccatggcc cgcaccccca agctgccact gcagcagtca 60
gagtggcagc tgaaggctcg gttcatgccg tgcccccggg cagttctggt gaggctaagc 120
aagaggcctc tgcatcttga cacctaggag agcagggacg gagtctccca gggtggagga 180
ccatgctgcg ccgcaagccc tccaatgcca gtgagaagga gcccactcag aagaaaaagc 240
tctcccttca gcgctccagc agcttcaagg attttgccaa atccaaaccc agctcccccg 300
tggtgagcga gaaggagttt aatctggatg ataacattcc agaagatgac tcaggtgtcc 360
ccaccccaga agatgctggg aagagtggca aaaagctggg gaagaagtgg agggcagtga 420
tttcccgaac catgaacagg aagatgggca agatgatggt gaaggccctg tcagaagaga 480
tggcagacac tctggaggag ggctctgcct ccccgacatc tccagactac agcctggaca 540
gccctggccc tgagaagatg gcgctggcct tttctgagca agaggagcat gaacttccgg 600
tgctcagccg ccaggcatca acaggcagtg agctctgcag ccccagccca ggttctggca 660
gcttcgggga ggaaccacct gccccccagt acacagggcc tttctgtggc cgggcacgag 720
tccacaccga cttcactccc agcccctatg accacgactc gctgaaactg cagaaaggag 780
atgtgatcca gatcattgaa aagccacctg tgggcacgtg gctgggccta ctcaatggca 840
aggtgggctc tttcaaattc atctatgtgg atgtgctgcc cgaggaggcc gtggggcatg 900
cccgccccag ccgccgacag agcaagggca agaggcccaa gcctaagacc ctgcatgagc 960
tgctggagcg catcggcctg gaggagcaca catccaccct cctgctcaat ggctaccaga 1020
cactggaaga cttcaaagag ctgcgagaaa cacacctcaa tgagctgaac atcatggatc 1080
cacagcaccg ggccaagctg ctcacggccg ccgagctgct gctggactat gacactggca 1140
gtgaggaggc tgaagagggc gccgagagca gccaggagcc agtggcacac acagtgtcgg 1200
aacccaaggt ggacatcccg cgcgactcag gctgctttga gggctcggag agcgggcgcg 1260
atgacgcaga gctggcaggc actgaggagc agctgcaagg cctctccctg gccggggcac 1320
cttgaggtgg cggtggcaat aggccaaggc tgggacccag ctgcaaaggc tgtaggagtg 1380
ggcccagcct cccgtggtgg cccaggtcct gaggactggc actgagcctg gccctgcttc 1440
cccagggaca cttagggcca cagaggccag gccagggccc tacaggttcc aggctcagct 1500
ggagtggttg gggagtcgcc caagggcaca tcccacctgc ctgagccccg ccctccacca 1560
gcgactgaca gcgcagcccc tcctggcacc aactgctccc ctgccatggc cacggccaca 1620
gcaagtgggg cactgggaaa ccctgcccat gtccctcacc aacaaggcct ccaaatcctc 1680
ctcaccccca caccacctac ccctgtcgca ctgctcctga aaagggggcc aagtcaatgt 1740
ttcaggtcag tctaaaaacc ctagggaagc tggccattta aaagaaccca aactgaccat 1800
gggtaaatcc agttccccta aataaggcct gaagaaatcc acaggtacca ttcccacttt 1860
ccttctccct agctttctta gaggtttggc cactaaatct tatgagactt gaaccaagtg 1920
gcttcctctt tctaggctta ggacgggttg gggttagaaa gggtgatcac tgaaggcctt 1980
gcctgctctg acattctgtg acattaaatg tctattctcc tgttacctgt ggcctgggac 2040
accagtgggg tttatcgagg ggaccagagg ggcctcaggc tttcagatga aatggctcct 2100
cctactcacc cactttattc ctctccatgt aattcaggac aagctgcaac ttcccccagc 2160
ttaacacaat gcccatacct catacgatat gcgccctccc gttccatccc tggccccctc 2220
aaacgagact tctcacaagg ctgattacag atggtcaaac ctggcttcca aggacagaat 2280
tgcctctcgg aagccagctg tggatctgag tccagagttg gccacttgtg tgggtcctca 2340
caagcaaaga gagcactaaa cttgacattg ggggtccacc actccaactt tgctttctga 2400
aggttttggt gtacattgag ccccagaagg aaaggagagt atctgtgagt gggggcctcc 2460
cttgacccca gtacgaagtc tatgccctga atccccagag tagcccttcc tggtgcccaa 2520
ctggcctggg gacaaacagc gtccactaca tctaggactg ccggctaagt ggacacactt 2580
cttgacctcc taccaggaac tttggtaaaa gctagctttg gggaaggggt tgggtgtaaa 2640
tatgagaggg tggagggaga ccagctggta gcaataaaca tgggtagaac taaaaaaaaa 2700
aaaaaaa 2707
机译: 鉴定癌前结肠息肉和结肠直肠癌的方法和试剂盒
机译: 鉴定癌前结肠息肉和结肠直肠癌的方法和试剂盒
机译: 鉴定癌前结肠息肉和结肠直肠癌的方法和试剂盒