首页> 中国专利> 一种基于多重PCR技术和DNB技术的STR分型方法

一种基于多重PCR技术和DNB技术的STR分型方法

摘要

本发明公开了一种基于多重PCR技术和DNB技术的STR分型方法,包括S1.提取待测样品DNA;S2.针对所选取的STR位点设计多重PCR引物并建立关于DNB环化中STR序列交叉互连的评估体系;S3.以步骤S1待测样本DNA为模板,利用步骤S2设计的多重PCR引物进行第一轮PCR扩增反应;S4.将第一轮PCR产物纯化,进行第二轮PCR扩增引入高通量Index;S5.将第二轮PCR扩增回收、纯化;S6.PCR产物进行DNB测序。本发明提供了通过一套适用于DNB测序和环化的STR序列交叉互连一整套评估体系,成功建立了基于多重PCR技术和DNB技术的STR分型方法。

著录项

说明书

技术领域

本发明涉及生物技术领域,更具体地,涉及一种基于多重PCR技术和DNB 技术的STR分型方法。

背景技术

短片段重复序列(short tandem repeat,STR)分型技术是目前国内外法医学进行个体识别和亲子鉴定的主要手段,具有简单快速、结果可靠、灵敏度高、重复性好的特点。常染色体STR、Y-STR和X-STR等多种遗传标记的联用对于二联体亲缘鉴定及更复杂的亲缘鉴定具有独特的应用价值。

当前法医STR分型检测方法主要为PCR-毛细管电泳法。该方法的主要原理为:①提取DNA,使用磁珠、酚/氯仿、Chelex等方法提取出纯度高、完整性好、浓度适当的DNA样品;②进行PCR扩增,PCR(聚合酶链式反应)技术是以待扩增的两条DNA链为模板,在一对人工合成的寡核苷酸引物的介导下,通过耐高温DNA聚合酶的酶促作用,快速特异地扩增出目的DNA片段;③毛细管电泳,是以Sanger酶法为原理,采用耐热DNA聚合酶参照待测模板生成一系列链终止片段。在此过程中,以4种不同的荧光染料标记反应产物,并将反应产物经过毛细管电泳分离,采用固定的激光光源对荧光信号进行激发,通过CCD(电荷耦合器件)检测收集数据,计算机分析处理得到序列信息的过程。④确定样品的STR分型。电泳后对荧光颜色不同的DNA片段的峰进行长度检测,将DNA 片段与内标进行比较确定其长度,并对应不同的颜色,最后与以同样方式确定的等位基因Ladder进行比较,得到样品的STR分型。目前基于传统的PCR-毛细管电泳的STR技术主要缺点为,一是同时检测的法医位点少,通量低,虽然多色荧光系统的升级推动了一次性检测位点数的增加,但是目前仍然难以超过60 个,与此同时法医学需求检测的常染色体 STR、YSTR和XSTR的数目逐年增加。二是获得序列信息的完整性有限。基于一代CE技术的传统STR分型法,只能获得扩增子的相对长度信息,无法获得STR重复区和侧翼区的完整碱基序列,未能充分考虑序列可能存在的变异及对测序结果的影响,限制了法医DNA检测的应用场景。

高通量测序技术(High-throughput sequencing)又称“下一代”测序技术 ("Next-generation"sequencing technology),该技术可以对数百万个DNA分子进行同时测序,这使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,堪称测序技术发展历程的一个里程碑。专利CN102943111A公开了高通量 DNA测序法用于测定人类基因组中短片段串联重复基因座的用途及方法,专利 CN104673907A公开了一种用于高通量检验STR分型的系统及其检测方法,但是上述基于传统高通量测序技术的STR分型方法的准确性依然有待提高。DNB 测序技术基于现有二代测序开发的新的测序技术,基因组DNA首先经过片段化处理,再加上接头序列,并环化形成单链环状DNA,随后使用的滚环扩增技术(Rollingcircle amplification,RCA)可将单链环状DNA扩增2-3个数量级,所产生的扩增产物称为DNA纳米球(DNAnanoball,DNB),最终纳米球经过DNB 装载技术固定在阵列化的硅芯片上。与其他二代测序技术相比较,DNB测序技术具有以下几个优势:(1)DNB通过增加待测DNA的拷贝数而增强了信号强度,从而提高测序准确度;(2)不同于PCR指数扩增,滚环扩增技术的扩增错误不会累积;(3)DNB与芯片上活化位点的大小相同,每个位点只固定一个DNB,保证信号点之间不产生相互干扰;(4)阵列化测序芯片和DNB测序技术的结合,使得成像系统像素和测序芯片的面积得到最大化利用。目前,现有技术中,还未见有基于多重PCR技术和DNB技术的STR分型方法。由于常规的 DNB测序方法形成单链环状DNA后,后续接着进行DNB的生成的测序,这一步对于基因组的随机片段或者没有固定结构的普通序列来说,影响不大。但对于存在高度重复结构、多种重复类型、碱基比例普遍失衡的STR序列而言,环化后DNB的生成和扩增可能产生严重的偏向性,甚至单链DNA本身就无法正常环化,进而严重影响测序结果的平衡。因此如何基于STR序列的特点,使用重 PCR技术和DNB技术进行STR分型,是目前亟需解决的问题。

发明内容

本发明的目的在于克服现有技术中存在的上述缺陷和不足,提供一种基于多重PCR技术和DNB技术的STR分型方法。

本发明的上述目的是通过以下技术方案给予实现的:

一种基于多重PCR技术和DNB技术的STR分型方法,包括如下步骤:

S1.待测样品预处理,提取待测样品DNA;

S2.针对待测STR基因座设计多重PCR引物并建立关于DNB环化中STR序列交叉互连的评估体系,调整多重PCR引物扩增方向;

S3.以步骤S1待测样品DNA为模板,利用步骤S2设计的多重PCR引物进行第一轮PCR扩增反应;

S4.将第一轮PCR产物纯化,进行第二轮PCR扩增引入高通量Index;

S5.将第二轮PCR扩增回收、纯化;

S6.PCR产物进行DNB测序;

步骤S2所述评估体系为对任意两条长度分别为m、n的扩增产物序列,在每个可能的碱基配对状态上,逐一移位进行相互比对,计算互连得分,即匹配碱基数和不匹配碱基数的差值;产生(m*n)次碱基比对和(m+n-1)次互连得分,取其中的最高得分作为m、n两条序列的最终互连得分;对于一组包含p条不同序列的集合,自身和两两比较,产生1/2(p

本发明采用多重PCR技术可在一个反应体系内同时检测多个不同的STR基因座,针对STR基因座存在高度重复结构、多种重复类型、碱基比例普遍失衡,环化后DNB的生成和扩增可能产生严重的偏向性,甚至单链DNA本身就无法正常环化的问题,本发明设计了一套适用于DNB测序和环化的STR序列交叉互连一整套评估体系,对于需要进行环化的一组STR目标序列(包括所有序列本身、正向和反向序列以及序列和序列之间)都进行严格的序列互补自连评估,从而调整出一套最优的序列方向组合,尽量保证STR序列间不发生严重的交叉互连反应。

优选地,所述待测STR基因座包括D1S1656、D2S1338、D2S441、TPOX、 D3S1358、FGA、CSF1PO、D5S818、D7S820、D8S1179、D10S1248、TH01、 D12S391、vWA、D13S317、D16S539、D18S51、D19S433、D21S11或D22S1045 中至少两个。

优选地,本发明在针对STR基因座位点进行引物设计时,除了遵循传统多重PCR引物设计原则,本发明还兼顾不同长度、类型和拷贝数STR位点扩增子间的均衡性,使得设计的PCR扩增引物能够精确涵盖用于STR长度计算的核心重复区,并且可根据二代测序序列起始质量较高的特点,通过调整STR重复区的起始位置,以达到最优的测序质量。

进一步优选地,所述STR基因座多重PCR引物分别包括上游引物和下游引物,其序列依次如SEQ ID NO:1~40所示。

优选地,所述第一轮PCR扩增反应的扩增体系为:JN-1500MIX 6μL,基因组DNA 20-300ng,3×EnzymeHT 10μL,加H

优选地,所述第一轮PCR扩增反应的扩增程序为98℃ 3~5min;98℃ 20s, 60℃6min,共20个循环;72℃ 6min。

优选地,所述第一轮PCR扩增反应的扩增体系为:2×HIFI_Enzyme 15μL,Nuclease-Free H

本发明步骤S4所述高通量Index采用目前本领域常用的高通量Index也可完成发明目的,不过为了更加充分发挥二代测序在高通量大样本上的优势,平摊二代测序的检测成本,本发明还提供一套超高通量Index,所述高通量Index要求根据碱基平衡和激光平衡原则、GC含量30~70%、连续重复碱基小于等于5、本身反向互补不一致、汉明距离大于3、与目前主流平台Index不冲突的严格条件。

优选地,第二轮PCR扩增反应的扩增程序为:98℃ 2min;98℃ 15s,58℃ 15s,72℃30s,6个循环;72℃ 2min。

本发明还请求提供上述任一所述的方法在个体识别和/或亲权鉴定中的应用。

与现有技术相比,本发明具有以下有益效果:

本发明提供了一种基于多重PCR技术和DNB技术的STR分型方法,通过一套适用于DNB测序和环化的STR序列交叉互连一整套评估体系,对于需要进行环化的一组STR目标序列(包括所有序列本身、正向和反向序列以及序列和序列之间)都进行严格的序列互补自连评估,从而调整出一套最优的序列方向组合,保证STR序列间不发生严重的交叉互连反应,保证了测序结果的平衡,成功建立了基于多重PCR技术和DNB技术的STR分型方法,从而用于个体识别和/或亲权鉴定。

附图说明

图1为本发明基于多重PCR技术和DNB技术的STR分型方法的操作流程图。

图2为本发明示例性说明某两种STR重复序列之间存在严重的交叉互连的处理情形。

图3为本发明优化得到的超高通量Index系统中某组96Index示例。

图4为标准品2800M的最终测序结果。

具体实施方式

以下结合说明书附图和具体实施例来进一步说明本发明,但实施例并不对本发明做任何形式的限定。除非特别说明,本发明采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。

除非特别说明,以下实施例所用试剂和材料均为市购。

实施例1

一种基于多重PCR技术和DNB技术的STR分型方法,其操作流程如图1 所示。主要步骤如下:

一、基于二代测序的多重PCR扩增技术

(1)多重PCR扩增子的引物设计:利用多重PCR扩增子捕获技术配合二代测序检测特定的一组STR panel,需要根据这组STR位点所在的序列区域特征,设计一整套特异性的扩增引物。为适应二代测序高通量的特点,往往一次设计几百重以上的PCR引物,除了遵循传统多重PCR引物设计原则,还兼顾不同长度、类型和拷贝数STR位点扩增子间的均衡性,使得设计的PCR扩增引物能够精确涵盖用于STR长度计算的核心重复区,并且可根据二代测序序列起始质量较高的特点,通过调整STR重复区的起始位置,以达到最优的测序质量。

引物设计示例如下表1所示:

注:Chr:染色体;LEN:长度;TM:50%的引物处于解离状态时的温度;

(2)一整套适用于DNB环化的STR序列交叉互连评估体系的设计

对于需要进行环化的一组STR目标序列(所有序列本身、正向和反向、序列和序列之间)都要进行严格的序列互补自连评估,从而调整出一套最优的序列方向组合,尽量保证STR序列间不发生严重的交叉互连反应。

示例:如图2所示,某两种STR重复序列之间存在严重的交叉互连,可以通过调整其中一种STR序列的测序方向来避免;

基于以上原理,我们设计了一整套适用于DNB测序和环化的STR序列交叉互连评估体系,综合考虑一组STR序列的重复类型、重复长度、碱基比例等影响因素,从整体上优化所有STR序列的测序方向,继而保证后续的正常环化和 DNB扩增,从而达到测序结果各位点间的均衡。

原理:对任意两条长度分别为m、n的序列,在每个可能的Watson-Crick碱基配对状态上,逐一移位进行相互比对,计算互连得分,即匹配碱基数和不匹配碱基数的差值。这个过程将产生(m*n)次碱基比对和(m+n-1)次互连得分,取其中的最高得分作为m、n两条序列的最终互连得分。对于一组包含p条不同序列的集合,自身和两两比较,将产生1/2(p

(3)靶区域扩增:按照下面所列反应体系和扩增条件进行第一轮PCR扩增。

扩增体系:采用0.2mL PCR管/96孔PCR板,在超净台里按照如下表2所述体系配置反应:

表2

PCR扩增程序如表3所示:

表3

*如DNA低于5ng,适当增加1个循环。

(4)一套适用于目前主流二代测序平台的超高通量Index系统的设计

作为一种优选地可实施方式,本发明为穷尽单端Index系统的效能,充分发挥二代测序在高通量大样本上的优势,我们设计了一套适用于目前主流二代测序平台的超高通量Index系统。根据碱基平衡和激光平衡原则、GC含量30~70%、连续重复碱基小于等于5、本身反向互补不一致、汉明距离大于3、与目前主流平台Index不冲突的严格条件,我们搜索了所有10bp长度Index的可能空间,最后优化了一套包含2016个Index(可按96或32个一组随机组合)的超高通量Index 系统,以及对应的高效拆分脚本。数据拆分默认允许1bp的容错空间,经过多批次的实验测试,该Index系统的最终下机数据拆分率达94%,最终用于样本位点分析的有效数据量高于80%,充分发挥了高通量测序平台并行测序大批量样本的优势。

以下表4为高通量2016Index系统碱基平衡评估:

表4

某组96Index示例,如图3所示。

(5)第一轮PCR产物纯化后,进行第二轮PCR扩增,并引入步骤(4)中二代测序相应的Index系统。第二轮PCR扩增的体系如表5所示:

表5

*不同的样品请使用不同的Barcode/Index。

PCR扩增程序如表6所示:

表6

*一般为6个循环,当原始DNA少于10ng时,用8循环。

(6)PCR产物回收。用纯化试剂盒或其他等效的磁珠对PCR产物进行纯化。

二、进行二代测序(DNB测序技术)

利用华大测序仪对上述PCR产物进行DNB测序。

实施例2

一种基于多重PCR技术和DNB技术的STR分型方法,与实施例1的方法相同,其中:

(1)STR位点信息:以Expanded CODIS core loci的20个常染色体STR为例,具体位点信息如下表7所示:

表7 Expanded CODIS core loci的20个常染色体STR

(2)STR位点引物信息

多重PCR初始引物设计如下表8所示,完全包含STR的重复区域:

表8

(3)关于DNB环化的STR序列交叉互连评估

按照多重PCR初始引物的扩增方向,我们得到扩增产物的重复序列,并根据重复类型、重复长度和碱基比例进行分类,如表9所示,共得到5种重复基序类型:

表9

对所有重复基序类型间可能存在的交叉互连反应进行计算评估。

原理:对任意两条长度分别为m、n的序列,在每个可能的Watson-Crick碱基配对状态上,逐一移位进行相互比对,计算互连得分,即匹配碱基数和不匹配碱基数的差值。这个过程将产生(m*n)次碱基比对和(m+n-1)次互连得分,取其中的最高得分作为m、n两条序列的最终互连得分。对于一组包含p条不同序列的集合,自身和两两比较,将产生1/2(p

具体到该例中,首先将各重复基序类型统一重复6次,如两个重复长度为4 的基序类型,重复6次后,得到两条24bp长度的序列,碱基逐一比对,将产生 576次碱基比对和47次互连得分(为考虑计算量,根据重复类型,可重复4-10 次,获得20-30bp长度的序列较为合适)。该组共包含10种基序类型(包括正向和反向),自身、两两之间分别比较,共产生55组比较结果(最高得分),其中有15组得分在7以上,列表如下表10所示:

表10

从上述结果表中,选择一套使得体系互连反应总得分最低的重复基序类型组合,并据此调整所有引物扩增方向,以保证扩增出的STR序列间不发生严重的交叉互连。

原理:每对反应得分的计算方式为,每种类型正向或反向选其一,根据会发生互连反应的两种类型,统计全部20个STR中属于这两种类型的位点数a、b,以及该互连反应的最高得分S,即可计算体系中该反应的得分a*b*S。一组类型在体系中的所有互连反应的得分加和,即为体系总得分。

具体到该例中,若选择的重复基序类型组合为1_rc,2_rc,3_rc,4_rc,5_rc,则其中会发生互连反应的类型为5_rc和5_rc,属于该类型的位点只有D22S1045,因此位点数分别为1和1,该互连反应的最高得分为7,因而体系中该反应的得分为1*1*7=7。因为该组合没有其他互连反应,所以体系总得分也为7,通过完全计算,我们发现该组合的体系总得分在所有组合中是最低的,因此该组合为最优的重复基序类型组合。据此,我们将所有位点的引物扩增方向进行调整,例如 D1S1656的原引物扩增方向为正向,重复基序类型为1,调整成反向扩增后,重复基序类型变为1_rc。

经过上述交叉互连评估和引物调整后,我们从整体上优化了Expanded CODIScore loci的20个常染色体STR的测序方向,继而保证后续的正常环化和 DNB扩增,从而达到测序结果各位点间的均衡。

(4)最终检测的分型结果

对于标准品2800M的最终测序结果如图4所示,表明本发明成功建立了基于多重PCR技术和DNB技术的STR分型方法,本发明基于多重PCR扩增体系,利用DNB测序技术位点多、通量高、成本低的特点进行STR分型,保证了测序结果的精确性和可靠性,同时也更适用于未来STR检测的标准化。

序列表

<110> 广州深晓基因科技有限公司

广州市刑事科学技术研究所

<120> 一种基于多重PCR技术和DNB技术的STR分型方法

<141> 2020-08-13

<160> 40

<170> SIPOSequenceListing 1.0

<210> 1

<211> 22

<212> DNA

<213> 人(Homo sapiens)

<400> 1

gcagcacaaa actcgtttag ca 22

<210> 2

<211> 26

<212> DNA

<213> 人(Homo sapiens)

<400> 2

tataagttca agcctgtgtt gctcaa 26

<210> 3

<211> 25

<212> DNA

<213> 人(Homo sapiens)

<400> 3

atgcctacat ccctagtacc tagca 25

<210> 4

<211> 24

<212> DNA

<213> 人(Homo sapiens)

<400> 4

ccagtggatt tggaaacaga aatg 24

<210> 5

<211> 22

<212> DNA

<213> 人(Homo sapiens)

<400> 5

ctgtaacaag ggctacagga at 22

<210> 6

<211> 29

<212> DNA

<213> 人(Homo sapiens)

<400> 6

caccacaccc agccataaat aacatatta 29

<210> 7

<211> 23

<212> DNA

<213> 人(Homo sapiens)

<400> 7

caccttcctc tgcttcactt ttc 23

<210> 8

<211> 23

<212> DNA

<213> 人(Homo sapiens)

<400> 8

ccttctgtcc ttgtcagcgt tta 23

<210> 9

<211> 21

<212> DNA

<213> 人(Homo sapiens)

<400> 9

ctgcagtcca atctgggtga c 21

<210> 10

<211> 23

<212> DNA

<213> 人(Homo sapiens)

<400> 10

ctcatgaaat caacagaggc ttg 23

<210> 11

<211> 29

<212> DNA

<213> 人(Homo sapiens)

<400> 11

atcacggtct gaaatcgaaa atatggtta 29

<210> 12

<211> 26

<212> DNA

<213> 人(Homo sapiens)

<400> 12

ctgcagggca taacattatc caaaag 26

<210> 13

<211> 22

<212> DNA

<213> 人(Homo sapiens)

<400> 13

acttggacag catttcctgt gt 22

<210> 14

<211> 23

<212> DNA

<213> 人(Homo sapiens)

<400> 14

cagattgtac agaggaggca ctt 23

<210> 15

<211> 22

<212> DNA

<213> 人(Homo sapiens)

<400> 15

ctctcccatc tggatagtgg ac 22

<210> 16

<211> 23

<212> DNA

<213> 人(Homo sapiens)

<400> 16

gtgacaaggg tgattttcct ctt 23

<210> 17

<211> 30

<212> DNA

<213> 人(Homo sapiens)

<400> 17

attgtgaggt cttaaaatct gaggtatcaa 30

<210> 18

<211> 30

<212> DNA

<213> 人(Homo sapiens)

<400> 18

aaagggtatg atagaacact tgtcatagtt 30

<210> 19

<211> 22

<212> DNA

<213> 人(Homo sapiens)

<400> 19

cacggcctgg caacttatat gt 22

<210> 20

<211> 30

<212> DNA

<213> 人(Homo sapiens)

<400> 20

gctgtcaaaa accgtatgta ttcttgtttc 30

<210> 21

<211> 27

<212> DNA

<213> 人(Homo sapiens)

<400> 21

aagcttagta cttaactcac tgccttg 27

<210> 22

<211> 30

<212> DNA

<213> 人(Homo sapiens)

<400> 22

ttcccttgtc ttgttattaa aggaacaact 30

<210> 23

<211> 25

<212> DNA

<213> 人(Homo sapiens)

<400> 23

aaatgacact gctacaactc acacc 25

<210> 24

<211> 22

<212> DNA

<213> 人(Homo sapiens)

<400> 24

cattggcctg ttcctccctt at 22

<210> 25

<211> 28

<212> DNA

<213> 人(Homo sapiens)

<400> 25

gtgatagtag tttcttctgg tgaaggaa 28

<210> 26

<211> 25

<212> DNA

<213> 人(Homo sapiens)

<400> 26

cttgcagatg gactgtcatg agatt 25

<210> 27

<211> 33

<212> DNA

<213> 人(Homo sapiens)

<400> 27

gagataggac agatgataaa tacataggat gga 33

<210> 28

<211> 29

<212> DNA

<213> 人(Homo sapiens)

<400> 28

cactttgccc ttattatttt gtgaactcc 29

<210> 29

<211> 23

<212> DNA

<213> 人(Homo sapiens)

<400> 29

attctgccta cagccaatgt gaa 23

<210> 30

<211> 25

<212> DNA

<213> 人(Homo sapiens)

<400> 30

caaatctcct ccttcaactt gggtt 25

<210> 31

<211> 28

<212> DNA

<213> 人(Homo sapiens)

<400> 31

ggtctaagag cttgtaaaaa gtgtacaa 28

<210> 32

<211> 23

<212> DNA

<213> 人(Homo sapiens)

<400> 32

gcgtttgtgt gtgcatctgt aag 23

<210> 33

<211> 26

<212> DNA

<213> 人(Homo sapiens)

<400> 33

cacttcactc tgagtgacaa attgag 26

<210> 34

<211> 27

<212> DNA

<213> 人(Homo sapiens)

<400> 34

gcaacaacac aaataaacaa accgtca 27

<210> 35

<211> 24

<212> DNA

<213> 人(Homo sapiens)

<400> 35

aaggaacagg tggtgttggt taca 24

<210> 36

<211> 28

<212> DNA

<213> 人(Homo sapiens)

<400> 36

gttgaggctg caaaaagcta taattgta 28

<210> 37

<211> 24

<212> DNA

<213> 人(Homo sapiens)

<400> 37

atatgtgagt caattcccca agtg 24

<210> 38

<211> 28

<212> DNA

<213> 人(Homo sapiens)

<400> 38

tgtattagtc aatgttctcc agagacag 28

<210> 39

<211> 22

<212> DNA

<213> 人(Homo sapiens)

<400> 39

cctctccacc ctatagaccc tg 22

<210> 40

<211> 27

<212> DNA

<213> 人(Homo sapiens)

<400> 40

cctcagctgt agaatggaaa tagtgac 27

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号