首页> 中国专利> 高通量DNA测序法用于测定人类基因组中短片段串联重复基因座的用途及方法

高通量DNA测序法用于测定人类基因组中短片段串联重复基因座的用途及方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种高通量DNA测序法用于测定人类基因组中短片段串联重复基因座的用途及方法，属于生物技术领域。该方法包括以下步骤：多样品基因座增殖子文库的准备；高通量DNA测序；数据分析及报告结果；本发明首次将高通量DNA测序技术应用于人类短片段串联重复（STR）基因座测定，明显提高了STR位点作为人类个体识别的分辨能力和灵敏度，同时极大地提高了STR检测的通量。

著录项

公开/公告号CN102943111A

专利类型发明专利
公开/公告日2013-02-27

原文格式PDF
申请/专利权人北京爱普益生物科技有限公司;
展开▼

申请/专利号CN201210466090.4
发明设计人周骋;姚志建;潘雅姣;陈琛;
展开▼

申请日2012-11-16
分类号C12Q1/68(20060101);
代理机构11138 北京三高永信知识产权代理有限责任公司;
代理人孟阿妮
地址 100176 北京市大兴区经济技术开发区地盛东路1号爱普益大厦
入库时间 2024-02-19 16:40:09

法律信息

法律状态公告日

法律状态信息

法律状态
2014-07-16

授权

授权
2013-03-27

实质审查的生效 IPC(主分类):C12Q1/68 申请日:20121116

实质审查的生效
2013-02-27

公开

公开

说明书

技术领域

本发明涉及生物技术领域，特别涉及一种高通量DNA测序法用于测定人类基因组中短片段串联重复基因座的用途及方法。

背景技术

在法医、刑侦及物证鉴定等工作中如何追踪、认定嫌疑人；在犯罪、灾害等事件中如何判定相关人员或遇难者；在亲属认定中如何确定亲缘关系等等是人类文明史中早就出现并不断探索的目标。当100多年前遗传学由于孟德尔（G.J.Mendel）的奠基性工作而成为一门学科以后，随着遗传学的每一个进展都使上述的工作有了更坚实的科学基础。

1985年英国遗传学家杰弗瑞斯（A.Jeffreys）首次提出所谓“DNA指纹”，指出在人类基因组中的某些区域具有重复序列，而且这类重复序列有个体差异（多态性）并能够遗传。使用DNA来行使个体鉴定有许多优点：（1）DNA作为遗传信号的载体存在个体差异，表现为形状上的差异；（2）DNA作为遗传的载体又是稳定的、与亲缘关系的基础；（3）人体上任何有核的细胞都可以作为DNA分析的对象；（4）DNA样品的稳定性较好。

最早用于检测遗传多态性的方法是使用限制性内切酶对人类基因组中可变数目串联重复（VNTR）做限制性片段长度多态性分析（RFLP），但是这个方法的缺点在于需要较为完整（分解的程度较低）并较为大量的样品，这对法医现场来说有时无法实现，同时，该方法的分辨度也较低。随着技术的发展，DNA聚合酶链式反应（PCR）的出现使对样品量的需求大大降低，将分析目标集中到VNTR中的较短的重复序列（STR），又使得较短的核酸片段也能够用于分析，加上多重PCR技术的应用，迅速使STR基因座的分型检测在法医和刑侦中迅速推广，并使收集相关人群STR分析结果的数据库日益扩大。

上述基因组中同一位点上的多态性表现为在这一位点上有两个或多个不同的核酸一级结构（核苷酸的种类或重复序列的个数等）被称为等位基因，分析等位基因的结构被称为基因分型。等位基因越多基因型就会越多，如等位基因的数目为n，就意味着有n种纯合子和 n(n-1)/2种杂合子。例如在某一位点上有10个等位基因，就应该存在10种纯合子和45种杂合子，即在这一位点上存在55种等位基因。在个体鉴定中需要同时检测多个位点（基因座）上的多态性，如果它们都是不连锁的，其基因座的频率可以相乘，如果提高基因座的数目就有可能大大提高个体鉴定的可信度。

上世纪90年代以来对STR通用的检测方法是以多重PCR检测约20个基因座的基因型，在检测中使用以荧光标记的引物并设计好扩增子的长度，使所产生的不同长短的具有荧光标记的针对每个基因座的扩增子在毛细管电泳中分离，并与标准物进行比对，从而实现对每个基因座中的等位基因进行分型。但是，这种方法也存在着由于技术上的限制而带来的缺陷，主要有：（1）由于荧光标记物的相互干扰和毛细管长度及成像技术等方面的限制，被分析基因座的数目已难以进一步大幅提升；（2）由于分析的对象是各个片段的长度大小，无法进一步检测到组成片段的核酸一级结构的微小差异，因此限制了检测的分辨度；（3）存在无效等位基因，致使不同的试剂盒有可能出现某些基因座测定结果的差异；（4）Stutter峰（片段分析中时而出现于主峰前的小峰）的干扰，尤其是存在混合样品时。

DNA测序法可以解决上述STR分析方法中的困扰，提高基因分型的解析度。但用荧光标记双脱氧终止毛细管电泳法（Sanger法）来进行STR分型则由于通量、成本等方面的原因难以成为一种可用于日常测定的实际方法，特别是对于数据库的建设。

发明内容

本发明实施例的目的是针对上述现有技术的缺陷，提供一种可以经济有效的实现多样本、多个位点同时测定的设想，不仅提高了STR检测的通量，同时提高了STR位点作为人类个体识别的分辨能力和灵敏度。

为了实现上述目的本发明采取的技术方案是：

高通量DNA测序法用于测定人类基因组中短片段串联重复基因座的用途，包括在法医及其他涉及人类STR基因座检测的相关领域,如基因诊断、人类遗传图谱构建和群体遗传学研究等领域中的应用。

本发明提供的另一个技术方案是：以高通量DNA测序法测定人类基因组中短片段串联重复基因座的方法，包括以下步骤：

（1）多样品基因座增殖子文库的准备

增殖子文库指两端连有不同接头的DNA片段，其中，一侧为测序接头：可以含样本标签，以区分不同样本的测序结果；另外一侧为固定接头：用于连接捕获颗粒，增殖子文库的制备方法采用扩增法或连接法：

a.扩增法：用带有接头序列的特殊引物组合进行多个样品的多重PCR，得到带有相应接头的目的片段，组成样品文库；

b.连接法：应用普通引物组合进行多个样品的多重PCR后，通过平末端连接将相应接头连接到扩增子片段上，组成样品文库；

（2）高通量DNA测序

a.测序模板制备：文库内容经一侧接头被固定在捕获颗粒上，每个颗粒携带一个单一的 DNA片段；将携带模板的颗粒及PCR试剂与油相乳化，形成了油包水的微反应器；整个片段文库的扩增平行进行，形成测序模板；

b.DNA测序：采用高通量测序仪进行DNA测序；

（3）数据分析及报告结果

a．数据质控

根据测序长度和质量，对原始数据进行过滤；

b．测序信息归类

根据测序结果中的样本标签序列信息进行，测序结果能够被有效归类至不同样本、不同 STR位点的文件夹中；

c．数据格式转换

将高通量DNA测序结果转换成目前STR分型结果的标准格式，即以STR基因座核心重复序列的重复次数表示，该步骤通过制作某基因座的标准“阶梯比对参比序列”或直接读取核心重复次数等多种方法进行；另外根据与标准参考序列比对发现的样本序列的微变异也会有所展示，以更好的反映该STR位点的多态性。

为了实现上述目的本发明采取的具体操作流程是：

（1）目的片段特异引物设计及验证

人类基因组中存在大量重复序列，重复序列数量的差异决定不同个体的遗传特征。

根据已公开的STR基因座序列信息进行引物设计，以测定未知样本中STR位点短片段串联重复次数。下表1列出40个常用于STR基因座的引物设计并实验证明其可用性。通常采用琼脂糖电泳对扩增产物的特异性和含量进行检测，采用测序法对扩增产物序列的准确性进行检测，从而证明其可用性。

表1 40个常用于扩增STR基因座的引物

（2）基因座增殖子文库的准备

a．融合引物扩增法：应用由上述目的片段特异性引物，接头和样本标签3部分组成的融合引物，经多样本的多重PCR扩增获得两端连有不同接头序列，并带有样本标签的目的片段，组成DNA文库。

融合引物是除了目的片段特异性引物外，还含有其他序列（包括测序接头、固定接头、样本标签）的长引物，其结构参见图2（以Ion torrent测序平台为例）。P接头即固定接头，用于DNA捕获磁珠连接及用通用引物测序；样本标签由约10个核苷酸组成以区别样品；A 接头即测序接头用于以通用引物测序。

b．连接法：应用上述的引物组合行多重PCR并得到目的片段，通过平末端连接获得两端分别连有Coded A接头和P接头的目的片段，组成DNA文库。具体流程为，STR基因座的扩增子→扩增子末端补平和磷酸化修饰→将Coded A接头和P接头连接到扩增子上→样品文库。

样品文库结构参见图3，P接头用于DNA捕获磁珠连接及用通用引物测序；带有10个核苷酸样本标签的A接头构成了CodedA接头，其中A接头用于结合测序引物，样本标签用以区别不同样品。

（3）高通量DNA测序

a．通过油包水PCR等方法扩增测序文库，以制备测序模板。以油包水PCR（emulsion PCR, ePCR）为例，具体流程为：文库内容经P接头被固定在捕获磁珠上，使每个磁珠携带一个单一的DNA片段→将水相的PCR试剂与油相的试剂乳化，形成了乳液，携带模板的磁珠与乳液混合后进入液滴中，其中每个液滴为一个油包水的微反应池→整个片段文库的扩增在每个油包水微反应池中平行进行，形成测序模板。

b．采用高通量测序仪进行DNA测序，例如用Ion Torrent个人化操作基因组测序仪（PGM）进行测序。

（4）数据分析及报告结果

a．数据质控

根据测序长度和质量，对原始数据进行过滤。

b．测序信息归类

根据样本标签信息和各STR位点的特异引物序列，将测序结果按照样本和STR基因座分别归类；

c．数据格式转换

STR分型结果以STR基因座核心重复序列的重复次数表示，具体操作步骤如下：

根据某STR基因座已知的分型结果，制作该基因座的标准“阶梯比对参比序列”；比如 CSF基因座多态性表现为5-9次的短序列重复，该基因座的“阶梯比对参比序列”为核心序列AGAT重复次数5-9的一组序列。通过序列比对，将序列信息转换为STR分型结果（参见下述序列表）；

数据转换中的阶梯比对参比序列例：

<CSF reference 5 sequence

GATATTAACAGTAACTGCCTTCATAGATAGAAGATAGATAGATTAGATAGATAGATAGAT AGATAGGAAGTACTTAGAACAGGGTCTGACACAGGAAATGCT

<CSF reference 6sequence

GATATTAACAGTAACTGCCTTCATAGATAGAAGATAGATAGATTAGATAGATAGATAGAT AGATAGATAGGAAGTACTTAGAACAGGGTCTGACACAGGAAATGCT

<CSF reference 7 sequence

GATATTAACAGTAACTGCCTTCATAGATAGAAGATAGATAGATTAGATAGATAGATAGAT AGATAGATAGATAGGAAGTACTTAGAACAGGGTCTGACACAGGAAATGCT

<CSF reference 8sequence

GATATTAACAGTAACTGCCTTCATAGATAGAAGATAGATAGATTAGATAGATAGATAGAT AGATAGATAGATAGATAGGAAGTACTTAGAACAGGGTCTGACACAGGAAATGCT

<CSF reference 9sequence

GATATTAACAGTAACTGCCTTCATAGATAGAAGATAGATAGATTAGATAGATAGATAGAT AGATAGATAGATAGATAGAT

d、未落在参比序列整数点上的处理

如果某样品的某STR基因座未完全落在阶梯的尺度上，例如测序结果显示其在第5与第六短重复区之间插入了2个核苷酸，根据比对结果此微变异也可转换为固定的非CODIS格式，记为CSF 8.2(AG5，6)。

e、除了制作基因座的标准“阶梯比对参比序列”，直接对重复序列进行计数等方法也可以实现STR数据格式转换。

本发明实施例提供的技术方案带来的有益效果是：

（1）将高通量测序的理念引入人类STR分型，使得STR测定由模糊的片段大小精确到 DNA序列；

（2）通过在DNA测序中引入样本标签，对不同来源的DNA分子加以标记区分，实现多样品的同时测序；

（3）高通量DNA测序和多重PCR技术的结合，使得对多样本的多个位点的同时测定成为可能。

（4）可以选择在多重PCR中使用长的融合引物，以直接扩增生成含有接头序列和样本标签的测序文库，避免繁琐的连接步骤。

（5）在测序通量一定的前提下，通过调增检测样本数、检测位点数和测序深度三个参数的比例，可以满足针对样本通量、检测精度和灵敏度的不同需要。

附图说明

图1是本发明实施例中提供的用高通量DNA测序法测定STR的流程图；

具体包括以下步骤：（1）目的片段特异引物设计及验证；（2）基因座增殖子文库的准备， DNA文库由经过特殊设计的融合引物经多重PCR直接扩增获得，或者由普通多重PCR产物的后续连接获得，此步骤需要对多重PCR体系进行优化，以保证多重PCR产物量的平衡性（3）乳液DNA聚合酶链式反应（emulsion PCR,ePCR）获得测序模板，通过携带单一DNA 片段的颗粒经乳液覆盖形成独立的PCR微反应池，实现整个片段文库的独立平行扩增；（4）高通量DNA测序；（5）数据分析及报告结果

图2是本发明实施例中提供的融合引物结构示意图；

A接头为测序引物区，P接头为捕获颗粒结合区，样本标签用以区分不同样本。

图3是样品文库结构示意图。

P接头用于DNA捕获磁珠连接及用通用引物测序，带有10个核苷酸样本标签的A接头构成了CodedA接头。

具体实施方式

本发明将高通量DNA测序法引入STR测定技术，可用于包括法医及其他涉及人类STR基因座检测的相关领域，包括基因诊断、人类群体遗传研究、基因作图等领域。为使本发明的目的、技术方案和优点更加清楚，下面以在法医人类STR位点检测领域的应用为例，结合附图对本发明的具体实施方式，以及与现有产品相比其检测报告内容更加详尽的优势作进一步描述。

1.材料

供试样品为未知分型结果的人基因组DNA样品10份（因篇幅限制以10份样品为例），采用高通量测序法对Identifiler试剂盒涵盖的Amelogenin基因座和15个STR基因座进行分型测定。其中2份样品（样品1,2)。

为体现本发明产品的优势，同时采用现有多色荧光STR检测试剂盒Amp F/STR Identifiler (Life technology)进行分型，并对两种测定方法的分型结果进行比较。

高通量测序法试剂由3个主要试剂盒组成，文库构建试剂盒（自行组装，包括扩增法和连接法两种文库构建试剂盒）；测序模板制备试剂盒（购自Ion Torrent公司）；测序试剂盒（购自Ion Torrent公司）

(1)文库构建试剂盒

1）扩增法文库构建试剂盒：包括10组含有不同样本标签的融合引物池，每组融合引物（Invitrogen合成）池含有16对带有相同样本标签的融合引物，以及包括PCR缓冲液、DNA 聚合酶、dNTPs（三磷酸脱氧核苷酸）在内的常规PCR组分（Roche）和核酸纯化试剂（AMPure Regent，Beckman）。

2）连接法文库构建试剂盒：包括以下3个组分

a)目的片段扩增试剂：由16个STR位点特异性引物（Invitrogen合成)构成的引物池和DNA 聚合酶等其他常规PCR组分（Roche）构成。

b)连接试剂：由含有不同样本标签的A接头10组和P接头（Invitrogen合成)，以及包括末端修饰酶（T4磷酸激酶和T4DNA聚合酶）、T4连接酶在内的连接试剂（购自NEB）和核酸纯化试剂（AMPure Regent,Beckman）组成。

c)连接产物扩增试剂：由文库增殖引物（Invitrogen)和高保真白金酶（Invitrogen)组成。

16个STR位点对应的上下游引物序列如下表：

样本标记序列如下表：

样本标签编号序列 1 CTAAGGTAAC（SEQ ID NO.33）

2 TAAGGAGAAC（SEQ ID NO.34） 3 AAGAGGATTC（SEQ ID NO.35） 4 TACCAAGATC（SEQ ID NO.36） 5 CAGAAGGAAC（SEQ ID NO.37） 6 CTGCAAGTTC（SEQ ID NO.38） 7 TTCGTGATTC（SEQ ID NO.39） 8 TTCCGATAAC（SEQ ID NO.40） 9 TGAGCGGAAC（SEQ ID NO.41） 10 CTGACCGAAC（SEQ ID NO.42）

接头序列如下表：

接头序列 A接头 CCATCTCATCCCTGCGTGTCTCCGACTCAG(SEQ ID NO.43) P接头 CCTCTCTATGGGCAGTCGGTGAT（SEQ ID NO.44）

文库增殖引物序列如下表：

引物序列上游引物 CCATCTCATCCCTGCGTGTCTCCGACTCAG(SEQ ID NO.45) 下游引物 CCTCTCTATGGGCAGTCGGTGAT（SEQ ID NO.46）

(2)测序模板制备试剂盒：由油相、水相两部分组成。油相主成分为矿物油，水相包括 PCR常规组分和目的片段捕获颗粒。

(3)测序试剂盒：由测序引物、测序反应酶、4种dNTP组成。

2.方法

多色荧光标记法检测步骤参照Amp F/STR Identifiler试剂盒的标准操作流程。

高通量测序法的具体操作步骤参见图1。

（1）样本的待测基因座文库建立

1）扩增法：由扩增法文库构建试剂盒完成，主成分融合引物设计示意图见图2。多重PCR 反应体系配制和反应程序如下：

a）PCR反应体系配制

取0.2Ep管置冰上加入下列试剂及样品并混合

b）按下列程序置PCR仪中进行PCR反应

c）文库提纯参照AMPure Regent操作说明。

2）连接法：由连接法文库构建试剂盒完成，目的片段扩增和接头连接程序如下：

a）目的片段扩增

ⅰPCR反应体系配制：取0.2Ep管置冰上加入下列试剂及样品并混合

ⅱ按下列程序置PCR仪中进行PCR反应：

ⅲ扩增子提纯：参照AMPure Regent操作说明进行

b）扩增子末端修饰

ⅰ末端修饰反应体系配制：取0.2Ep管置冰上加入下列试剂及样品并混合

ⅱ按下列程序反应：

ⅲ末端修饰后扩增子提纯：参照AMPure Regent操作说明进行

c）接头连接

ⅰ连接反应体系配制：取0.2Ep管置冰上加入下列试剂及样品并混合

BSA】 P接头(1μM) 2 含样本标签的A接头1-10(1μM) 2 DNA连接酶(2000U/μL) 2 无核酸酶的水 5 总体积 40

ⅱ连接程序：室温10分钟

ⅲ连接产物提纯：参照AMPure Regent操作说明进行

d)切口平移、文库扩增和纯化

ⅰ反应体系配制：取0.2Ep管置冰上加入下列试剂及样品并混合

成分体积（μL）上述连接产物10-100ng 25 高保真白金酶混合液 100 文库增殖引物*(10μM each) 5 总体积 130

*文库增殖上下游引物分别为A接头正链和P接头互补链，以保证正确连接产物得以增殖。

ⅱ按下列程序反应：

*循环数由扩增模板量决定，模板量10ng设8个循环，100ng设5个循环。

ⅲ增殖文库提纯：参照AMPure Regent(Beckman)操作说明进行

（2）测序模板准备

该步骤由测序模板制备试剂盒完成，油包水PCR反应体系配制和反应程序如下：

1）PCR反应体系配制：

水相充分涡旋混匀后，通过表面连有的与文库P接头互补的一段序列，捕获颗粒与文库P接头连接，再以10:1比例掺入油相并充分混分，形成油包水PCR微反应池。

2）PCR扩增条件

（3）高通量DNA测序

可采用任何一种高通量测序议和配套测序试剂盒进行，例如使用Ion Torrent PGM（购自Life Technologies）。

（4）数据处理

由Nextgene分析软件(Softgenetics)完成，包括数据质控、测序数据归类和分型结果转换三个步骤。

质控参数设置：Mean Score(质量平均分值)≥16，片段长度≥55碱基

数据归类参数设置：Barcode sorting（按样本标签归类）必须10个碱基全部吻合，Primer Sorting(按位点引物归类）可允许3个以内碱基错配。

分型结果转换参数：如同样本、同位点内超过35%的测序结果与某参考序列吻合，则转换为该参考序列对应的STR分型。

（5）结果分析

为使两种方法的结果具有可比性，将二者检测结果统一为不同allele%，其中高通量测序法以不同allele读数所占百分比表示，多色荧光标记法以不同allele峰高所占百分比表示，采用Chi-square对两种方法检测结果的一致性进行分析。

结果显示，以高通量测序法不同allele读数百分比为观察值，以多色荧光法不同allele峰高百分比为期望值，两份样本中所有16个位点的P值均大于0.05，说明两种方法的检测结果基本一致，现行的多色荧光法的分型标准（包括背景噪音、纯合型和杂合型的界定标准）对于高通量测序法也是基本可行的。

采用现有多色荧光法分型标准，以高通量测序法不同allele百分比为依据进行分型，对 10份样品的分型结果如表2所示，其中样品1、2的分型结果与多色荧光法完全一致（表1）。

与多色荧光法相比，高通量测序法可以检测DNA序列的微变异，比如基因座D3S1358 的15和16分型均可以细化为15A（[AGAT]₁₁[AGAC]₃AGAT），15B（[AGAT]₁₂[AGAC]₂AGAT）和16A（[AGAT]₁₂[AGAC]₃AGAT）,16b（[AGAT]₁₃[AGAC]₂AGAT）。高通量测序法可以将结果精确为15A和16A（表1），而多色荧光法则仅能显示15,16。

高通量测序法不仅可以实现现有多色荧光法的分型功能，两种方法的检测结果具有一定的可比性，并且由于高通量测序可以显示STR位点及其侧翼DNA序列的微小差异，是一种更加精确、有效的检测人类STR基因座的手段。

表1.两种方法（多色荧光法和高通量测序法）基因座分型结果列表

St:Stutter allele的简写，由于DNA聚合酶滑脱产生的背景噪音。

表2.采用高通量测序法对10份样品共计16个位点（包括1个性别位点Ame）的分型结果

2）高通量DNA测序结果例（样品10）：

a.数据质控结果

原始数据FASTQ文件（334，966条测序），经质量筛选（保留Mean Score≥16的测序结果)滤掉7180条测序，长度筛选（保留长度≥55碱基的测序结果）滤掉3169条测序，共得到296093条符合质控要求的测序结果用于后续数据处理。

b．测序信息归类

上述296093条测序根据样本标签序列信息进行，被有效归类至不同样本文件夹，结果如下：

表3.样本标签归类结果

以样本10为例，根据引物序列对该样本的17586条测序结果进行归类，结果如下：

表4.位点归类结果（样本10)

c．数据格式转换

根据与标准“阶梯比对参比序列”比对结果进行分型，结果如下：

1)CSFIPO 12,13

47%reads

>GATATTAACAGTAACTGCCTTCATAGATAGAAGATAGATAGATTAGATAGATAGATAGATAGATAGATAGATAGATAG ATAGATAGATAGATAGGAAGTACTTAGAACAGGGTCTGACACAGGAAATGCT

51% reads

>GATATTAACAGTAACTGCCTTCATAGATAGAAGATAGATAGATTAGATAGATAGATAGATAGATAGATAGATAGATAG ATAGATAGATAGATAGATAGGAAGTACTTAGAACAGGGTCTGACACAGGAAATGCT

2)FGA 21,25

54%reads

>AAATAAAATTAGGCATATTTACAAGCTAGTTTCTTTCTTTCTTTTTTCTCTTTCTTTCTTTCTTTCTTTCTTTCTTTC TTTCTTTCTTTCTTTCTTTCTTTCTCCTTCCTTCCTTTCTTCCTTTCTTTTTTGCTGGCAATTACAGACAAATCACTCA GC

43%reads

>AAATAAAATTAGGCATATTTACAAGCTAGTTTCTTTCTTTCTTTTTTCTCTTTCTTTCTTTCTTTCTTTCTTTCTTTC TTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTCCTTCCTTCCTTTCTTCCTTTCTTTTTTGCTGGCAATT ACAGACAAATCACTCAGC

3)TH01(7,9)

52%reads

>CCTGTTCCTCCCTTATTTCCCTCATTCATTCATTCATTCATTCATTCATTCATTCATTCACCATGGAGTCTGTGTTCC C

47%reads

>CCTGTTCCTCCCTTATTTCCCTCATTCATTCATTCATTCATTCATTCATTCACCATGGAGTCTGTGTTCCC

4)VWA(16,20)

48%reads

>TCAGTATGTGACTTGGATTGATCTATCTGTCTGTCTGTCTGTCTATCTATCTATCTATCTATCTATCTATCTATCTAT CTATCTATCCATCTATCCATCCATCCTATGTA

45%reads

>TCAGTATGTGACTTGGATTGATCTATCTGTCTGTCTGTCTGTCTATCTATCTATCTATCTATCTATCTATCTATCTAT CTATCTATCTATCTATCTATCTATCCATCTATCCATCCATCCTATGTA

5)D3S1358(16,17)

54%reads

>CACTGCAGTCCAATCTGGGTGACAGAGCAAGACCCTGTCTCATAGATAGATAGATAGATAGATAGATAGATAGATAGA TAGATAGATAGATAGACAGACAGACAGATACATGCAAGCCTCTGTTGATTTCA

40%reads

>CACTGCAGTCCAATCTGGGTGACAGAGCAAGACCCTGTCTCATAGATAGATAGATAGATAGATAGATAGATAGATAGA TAGATAGATAGATAGATAGACAGACAGACAGATACATGCAAGCCTCTGTTGATTTCA

6)D5S818(10,12)

53%reads

>AGGGTGATTTTCCTCTTTGGTATCCTTATGTAATATTTTGAAGATAGATAGATAGATAGATAGATAGATAGATAGATA GATAGAGGTATAAATAAGGATACAGATAAAGATACAAATGTTGTAAACTGTGGCTATGATTGG

45%reads

>AGGGTGATTTTCCTCTTTGGTATCCTTATGTAATATTTTGAAGATAGATAGATAGATAGATAGATAGATAGATAGATA GATAGATAGATAGAGGTATAAATAAGGATACAGATAAAGATACAAATGTTGTAAACTGTGGCTATGATTGG

7)D7S820(8)

96%reads

>AGGGTATGATAGAACACTTGTCATAGTTTAGAACGAACTAACGATAGATAGATAGATAGATAGATAGATAGATAGACA GATTGATAGTTTTTTTTAATCTCACTAAATAGTCTATAGTAAACATTTAATTACCAATATTTGGTGCAATTCTGTCAAT GA

8)D8S1179(16,17)

50% reads

>ACACGGCCGGGCAACTTATATGTATTTTTGTATTTCATGTGTACATTCGTATCTATCTGTCTATCTATCTATCTATCT ATCTATCTATCTATCTATCTATCTATCTATCTATCTATTCCCCACAGTGAAAATAATCTACAGGATAGGTAAATAAATT AAGGCATATTCACGCAATGGGATACGATA

46% reads

>ACACGGCCGGGCAACTTATATGTATTTTTGTATTTCATGTGTACATTCGTATCTATCTGTCTATCTATCTATCTATCT ATCTATCTATCTATCTATCTATCTATCTATCTATCTATTCCCCACAGTGAAAATAATCTACAGGATAGGTAAATAAATT AAGGCATATTCACGCAATGGGATACGATA

9)D13S317(8,9)

43%reads

>GGACTCTGACCCATCTAACGCCTATCTGTATTTACAAATACATTATCTATCTATCTATCTATCTATCTATCTATCAAT CAATCATCTATCTATCTTTCTGTCTGTCTTTTTGGGCTGCCTATGGCTC

54%reads

>GGACTCTGACCCATCTAACGCCTATCTGTATTTACAAATACATTATCTATCTATCTATCTATCTATCTATCAATCAAT CATCTATCTATCTTTCTGTCTGTCTTTTTGGGCTGCCTATGGCTC

10)D16S539(9,13)

49%reads

>CCTCTTCCCTAGATCAATACAGACAGACAGACAGGTGGATAGATAGATAGATAGATAGATAGATAGATAGATATCATT GAAAGACAAAACAGAGATGGATGATAGATACATGCTTACAGATGCA

47%reads

>CCTCTTCCCTAGATCAATACAGACAGACAGACAGGTGGATAGATAGATAGATAGATAGATAGATAGATAGATAGATAG ATAGATAGATATCATTGAAAGACAAAACAGAGATGGATGATAGATACATGCTTACAGATGCA

11)D18S51(16,17)

54%reads

>TGAGTGACAAATTGAGACCTTGTCTCAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAA AGAAAGAAAGAAAAAGAGAGAGGAAAGAAAGAGAAAAAGAAAAGAAATAGTAGCAACTGTTATTGTAAGAC

40%reads

>TGAGTGACAAATTGAGACCTTGTCTCAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAA AGAAAGAAAGAAAGAAAAAGAGAGAGGAAAGAAAGAGAAAAAGAAAAGAAATAGTAGCAACTGTTATTGTAAGAC

12)D21S11(29,32.2)

50%reads

>AATTCCCCAAGTGAATTGCCTTCTATCTATCTATCTATCTGTCTGTCTGTCTGTCTGTCTGTCTATCTATCTATATCT ATCTATCTATCATCTATCTATCCATATCTATCTATCTATCTATCTATCTATCTATCTATCTATCTATCTATCGTCTATC TATCCAGTCTATCTACC

46%reads

>AATTCCCCAAGTGAATTGCCTTCTATCTATCTATCTATCTGTCTGTCTGTCTGTCTGTCTGTCTATCTATCTATATCT ATCTATCTATCATCTATCTATCCATATCTATCTATCTATCTATCTATCTATCTATCTATCTATCTATCTATCTATCTAT ATCTATCGTCTATCTATCCAGTCTATCTACC

13)TPOX(8)

94%reads

>CTTAGGGAACCCTCACTGAATGAATGAATGAATGAATGAATGAATGAATGTTTGGGCAAATAAACGCTGACAAGGAC 14）D2S1338(17)

96%reads

>TGGAAACAGAAATGGCTTGGCCTTGCCTGCCTGCCTGCCTGCCTGCCTTCCTTCCTTCCTTCCTTCCTT CCTTCCTTCCTTCCTTCCTTCCCTCCTGCAATCCTTTAACTTACTG

15）D19S433(14)

>CCTGGGCAACAGAATAAGATTCTGTTGAAGGAAAGAAGGTAGGAAGGAAGGAAGGAAGGAAGGAAGGAAGGAAGGAAG GAAGGAAGGAAGGAGAGAGGAAGAAAGAGAGAAGATTTTTATTCGGGTAATGGGTGCACC

16)Aml(X,Y)

54%reads

>CCCTGGGCTCTGTAAAGAATAGTGTGTTGATTCTTTATCCCAGATGTTTCTCAAGTGGTCCTGATTTTACAGTTCCTA CCACCAGCTTCCCAGTTTAAGCTCTGAT

46%reads

>CCCTGGGCTCTGTAAAGAATAGTGTGTTGATTCTTTATCCCAGATAAAGTGGTTTCTCAAGTGGTCCTGATTTTACAGT TCCTACCACCAGCTTCCCAGTTTAAGCTCTGAT

本发明具有如下优点：

1.提高STR位点用于个体识别的分辨力

（1）结果展示状态：现有检测技术以涵盖STR区段的PCR增值子的长度来推测短片段重复次数，PCR产物长度的检测不仅要添加系列allele ladder作为标准，降低了检测通量，而且存在一定误差[以310型毛细管电泳仪为例，针对Amp F/STR试剂盒16个位点所有 Allelic Ladder的标准差（Std Deviation）介于0.02到0.15（参照试剂盒说明书）]，而通过DNA测序法得到的DNA序列信息不仅能够更加真实、直观的反映STR区段内的短片段重复次数，并且能够进一步检测到该区域的序列微变异。

（2）检测位点数：受荧光标记和泳道长度的限制，现有检测技术一次性检测的STR位点数目一般在20个左右，而对于高通量DNA测序，一次性检测的位点数仅限于多重PCR可以囊括的反应数（目前多重PCR最多可以实现2000个位点同时扩增），检测的位点数比现有毛细管电泳法的检测位点数明显提高。

基于以上两点，以本发明提供的基于高通量DNA测序检测人类STR的方法，使测定分辨力由片段大小提升到对每个核苷酸逐个检测的DNA测序，并可以增加一次性检测的STR位点数，将极大提高STR位点用于个体识别的分辨力。

2.提高检测灵敏度

现有STR检测基于荧光标记的PCR扩增技术及毛细管电泳的片段分析，对模板DNA的量有一定的要求，高通量测序可以实现痕迹量甚至单个DNA分子的检测，由此带来的灵敏度极大提高，对于特殊微量检材的测定有重大意义。

3.提高样品通量

受毛细管电泳仪检测通道的限制，现有STR检测技术一次性测定样本数目有限。而高通量DNA测序技术的样品容量仅取决于测序通量包括电子元件的集成度等因素，并且可以根据需要对不同来源的DNA分子加以标记区分，极大程度的提高了检测通量。

本发明将高通量DNA测序法引入STR测定技术，形成新一代STR分析技术。新一代的STR 测定技术建立在新近出现的高通量DNA测序平台上，使STR测定由片段（数十到数百个核苷酸的聚合物）提升到对每个核苷酸逐个检测的DNA测序水平，并且由于不再受荧光标记技术限制，可以同时测定的基因座数目更多，极大的提高了STR作为人类个体识别多态性DNA标记的分辨力。高通量DNA测序通过样本标签区分不同来源的DNA测序分子，以长度为10-12 个碱基的样本标签为例，理论上可以组成的标签数目为4¹⁰，只要测序通量足够大，一次性可以检测的样本通量远高于现有检测手段。这些改进使得STR分型检测在个体鉴定等应用领域中准确度和检测通量进一步提高。

本发明还包括以高通量DNA测序法测定人类基因组中短片段串联重复基因座所引伸的应用（包括在法医及其他涉及人类STR基因座检测的相关领域中的应用）及相关产品。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 高通量DNA测序法用于测定人类基因组中短片段串联重复基因座的用途及方法 [P] . 中国专利： CN102943111B . 2014-07-16
2. Genotyping Legionella pneumophila comprises coamplifying variable-number-tandem-repeats loci in medium having L. pneumophila DNA sample, analyzing amplicon and assigning numerical multiple locus variable number tandem repeat analysis code [P] . 法国专利： FR2960552A1 . 2011-12-02

机译：对肺炎军团菌进行基因分型包括在具有肺炎链球菌DNA样品的培养基中共扩增可变数串联重复基因座，分析扩增子并分配数字多基因座可变数目串联重复分析代码
3. Nucleotide sequences of the mutant and non-mutant fragments of loci A and C of alleles of double low (00) fad3 form desaturase gene and low-linolenic mutant (LLMut) of oilseed rape plants (Brassica napus L. var. Oleifera), allospecific SNP markers specific for loci A and C of fad3 form desaturase gene - double low (00) and low-linolenic mutant (LLMut) of winter oilseed rape plants, nucleotide sequences of primer pairs for the amplification of loci A and C of fad3 form desaturase gene of winter oilseed rape plants, method for amplification of loci A and C of fad3 desaturase gene of winter oilseed rape plants, nucleotide sequences of the primers for the identification of mutant and non-mutant alleles of fad3 forms desaturase gene - double low (00) and low-linolenic mutant (LLMut) of oilseed rape in locus A and locus C in the microsequencing reaction, method for the identification of mutant and non-mutant alleles of fad3 form desaturase gene - double low (00) and low-linolenic mutant (LLM [P] . PL211126B1 . 2012-04-30

机译：双低（00）fad3等位基因的等位基因双低等位基因（A）的位点A和C的突变和非突变片段的核苷酸序列形成去饱和酶基因和油菜植物（甘蓝型油菜）的低亚麻酸突变体（LLMut），是同种异体对fad3基因座A和C特异的SNP标记形成去饱和酶基因-冬季油菜植物的双低（00）和低亚麻酸突变体（LLMut），用于扩增fad3基因去饱和酶A和C的引物对的核苷酸序列冬季油菜植物基因，fad3去饱和酶基因的基因座A和C的扩增方法，用于鉴定fad3形式脱氢酶基因的突变和非突变等位基因的引物的核苷酸序列-双低（00 ）和基因座A和基因座C中油菜的低亚麻酸突变体（LLMut）的微测序反应，fad3形式脱氢酶基因突变和非突变等位基因的鉴定方法-双低（00）和低亚麻酸突变体（法学硕士
4. High throughput, possibly automated, process for transposition-mediated sequencing of target DNA fragments in which the amount of non-target DNA sequence is minimised [P] . NZ523507A . 2005-01-28

机译：高通量，可能是自动化的，用于目标DNA片段的转座介导测序的方法，其中非目标DNA序列的数量最少