首页> 中国专利> 一种检测多囊肾疾病基因突变的捕获探针、试剂盒和检测方法

一种检测多囊肾疾病基因突变的捕获探针、试剂盒和检测方法

摘要

本申请涉及基因检测领域,具体提供一种检测多囊肾疾病基因突变的捕获探针、试剂盒及其检测方法,本申请具有捕获效率高、假阳性率低、准确率高、操作简单、节约成本等诸多优势。

著录项

  • 公开/公告号CN114774515A

    专利类型发明专利

  • 公开/公告日2022-07-22

    原文格式PDF

  • 申请/专利权人 北京安智因生物技术有限公司;

    申请/专利号CN202210298474.3

  • 申请日2022-03-24

  • 分类号C12Q1/6806;C12Q1/6883;C12Q1/6869;C40B50/06;C12N15/11;G16B20/50;G16B25/20;G16B35/10;G16B35/20;G16B50/10;G16B50/30;

  • 代理机构北京蕙识同联专利代理事务所(特殊普通合伙);

  • 代理人刘晔

  • 地址 100176 北京市大兴区北京经济技术开发区科创三街24号2号楼2-3厂房一层

  • 入库时间 2023-06-19 16:04:54

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-22

    公开

    发明专利申请公布

说明书

技术领域

本申请涉及基因检测技术领域,具体提供一种检测多囊肾疾病基因突变的捕获探针、试剂盒和检测方法。

背景技术

多囊肾疾病(polycystic kidney disease,PKD)是一种常见的以双肾形成多个进行性增大囊肿为主要特征的单基因遗传病。根据遗传特征不同,可以分为常染色体显性多囊肾(Autosomal dominant polycystic kidney disease,ADPKD),和常染色体隐性多囊肾(Autosomal recessive polycystic kidney disease,ARPKD)。ADPKD主要由PKD1和PKD2两个基因突变引起,基因产物分别为Polycystin-1(PC1)和Polycystin-2(PC2);ARPKD则由PKHD1基因突变引起,基因产物为Fibrocystin/Polyductin(FPC)。除了PKD1、PKD2和PKHD1外,还发现多个与多囊肾相关的基因,包括ALG8、ALG9、ANKS6、COL4A3、COL4A4、COL4A5、COL4A6、DNAJB11、DZIP1L、FLCN、GANAB、HNF1B、LRP5、MYH9、TSC1、TSC2、VHL等基因。

常染色体显性遗传性多囊肾病(ADPKD)是最常见的遗传性肾脏疾病,患者多在成人以后才出现症状,但在胎儿期即开始形成,患者幼时肾大小形态正常或略大,随年龄增长囊肿数目及大小逐渐地增多和增大,多数病例到40~50岁时肾体积增长到相当程度才出现症状,主要表现为两侧肾肿大、肾区疼痛、血尿及高血压等,群体中发病率为1/400-1/1000。ADPKD是由蛋白激酶D1(PKD1)(约85%的病例)或蛋白激酶D2(PKD2)(约15%的病例)突变引起的。与PKD2基因突变型相比,PKD1基因突变型患者终末期肾病发生时间要早20年。ADPKD的外显率近100%,患者子女的再发风险为50%。常染色体隐性遗传性多囊肾病(ARPKD)的发病率约为1/20000,而其突变携带者(杂合子)约为1/70。多囊肾患者的肾小球囊内上皮细胞异常增殖是多囊肾的显著特征之一,处于一种成熟不完全或重发育状态,高度提示为细胞的发育成熟调控出现障碍,使细胞处于一种未成熟状态,从而显示强增殖性;上皮细胞转运异常是多囊肾的另一显著特征,表现为细胞转运密切相关的Na

PKD1基因定位于16号染色体的短臂上(16p13.3),基因全长约52kb,含有46个外显子,mRNA长约14.2kb,编码由4303个氨基酸残基构成的跨膜蛋白——多囊蛋白1(polycystin 1,PC1),介导细胞与细胞之间、细胞与细胞基质之间的相互作用,促进上皮细胞分化,维持细胞极性。PC1水平降低可导致ADPKD的临床特征。PKD2基因定位于4号染色体上(4q22-23),基因全长约68kb,含有15个外显子,mRNA长约3kb,编码由968个氨基酸残基构成的膜蛋白——多囊蛋白2(polycystin 2,PC2),可增加细胞膜对钙离子的通透性,发挥Ca

到目前为止,在人类基因突变数据库(human gene mutation database,HGMD)中已经报道了2000多种PKD1基因突变和300多种PKD2基因突变,不仅突变类型各异(包括错义突变、无义突变、剪接异常突变、插入和/或缺失、复杂重排),而且分布于基因的不同位置,无突变热点,成为ADPKD患者基因分析的一大难题。同时,PKD1基因第1-33外显子存在6个序列高度相似的假基因,同源性高达97.7%(见图1),且大约80%的致病突变发生在此区域。此外,基因空间结构复杂,部分区域GC含量高达70%-80%,也使突变检测面临困难与挑战。因此,对于ADPKD患者的遗传学分析,常因涉及的外显子数目多(PKD1基因46个外显子和PKD2基因15个外显子)、没有突变热点、基因组内存在复杂区域等原因,缺乏一种快速、高效、准确的序列分析方法。

现有产品对多囊肾疾病基因的检测普遍存在一定不足,比如:1)检测的基因较少,较多的是检测6个基因,大多数都只能检测2个基因;2)检测时很难避免假基因的干扰,即使使用LR-PCR,还是无法彻底解决假基因带来的问题;3)通过LR-PCR检测,检测范围有局限性,不能够检测结构变异,而且检测效率也受到限制。

有鉴于此,提出本申请。

发明内容

针对上述现有技术缺陷,本申请寻求一种可识别归类测序序列在基因组上的位置,并能够高效捕获多囊肾疾病相关基因区域的方法和系统,该产品可以有效降低成本,减少工作量,检测变异类型全面、准确率高、通量高。

为达到上述目的,本申请提出一种利用blocker封闭TELL-Seq接头序列,再通过探针捕获目标区域进行NGS测序,从而达到高深度测序来识别多囊肾疾病相关基因的单点突变(single nucleotide polymorphism,SNP)、拷贝数变异(copy number variation,CNV)和结构变异(structure variation,SV)检测。

具体的,本申请所采用的技术方案如下:

本申请首先提供一种用于多囊肾疾病基因测序的文库构建方法,包括如下步骤:

1)对样本DNA添加index;

2)使用blocker对index进行封闭处理;

3)加入捕获探针对目标区域进行捕获;

4)文库洗脱和PCR扩增;

5)文库纯化和定量。

进一步的,所述1)是基于TELL-Seq技术对样本DNA添加index。

进一步的,所述2)中blocker为能够与18bp接头序列特异性互补结合的blocker序列。

进一步的,所述3)中捕获探针是针对基因PKD1、PKD2全长的探针,和针对基因PKHD1、ALG8、ALG9、ANKS6、COL4A3、COL4A4、COL4A5、COL4A6、DNAJB11、DZIP1L、FLCN、GANAB、HNF1B、LRP5、MYH9、TSC1、TSC2和VHL全编码区及可变剪切区的探针。

进一步的,所述探针序列如SEQ ID NO.1-227所示。

进一步的,所述方法可具体包括如下步骤:

1)基于TELL-Seq技术对样本DNA添加index:

2)使用blocker对index进行封闭处理:在步骤1的文库中加入blocker,混匀并通过PCR杂交程序进行杂交反应;

3)加入捕获探针对目标区域进行捕获:混合DNA模板与所需试剂离心混匀,并通过PCR杂交程序进行杂交反应;

4)文库洗脱和PCR扩增:使用链霉亲和素磁珠清洗、捕获,将链霉亲和素磁珠加入到杂交体系中,混匀孵育后完成洗脱;文库中加入PCR反应液,按标准PCR反应条件进行PCR扩增。

5)文库纯化和定量。

本申请还提供一种用于多囊肾疾病基因测序文库构建的捕获探针集,所述探针序列如SEQ ID NO.1-227所示。

本申请还提供一种用于多囊肾疾病基因测序文库构建的产品,其特征在于,包括上述的捕获探针集。

本申请还提供上述捕获探针集在制备用于多囊肾疾病检测试剂盒中的应用。

本申请还提供一种多囊肾疾病检测方法,其特征在于,包括上述方法,并进一步包含如下步骤:

测序及数据分析步骤和变异结果注释及解读步骤;

所述测序及数据分析步骤包括:

1)Illumina平台测序仪进行测序。

2)对测序结果进行拆分及校正,并进行测序数据质控;

3)将测序结果文件比对到人类基因组参考序列hg19/GRCh37,分析数据目标区域的覆盖度情况,对测序数据进行质控;

4)对目标区域的SNP、CNV及SV进行检测;

所述变异结果注释及解读步骤包括:

1)根据ClinVar、1000G、HGMD、ClinGen、dbVar、gnomAD数据库,对检测到的SNP及INDEL、CNV和SV进行注释,分析突变对多囊肾疾病的致病性;

2)依据ACMG指南标准,对突变进行人工解读,筛选出致病突变,并根据致病性结果出具检测报告。

本申请还提供一种多囊肾疾病检测系统,其特征在于,包括文库构建模块、测序及数据分析模块、和变异结果注释及解读模块;

所述文库构建模块用于执行上述所述文库构建方法;

所述测序及数据分析模块用于执行如下:

1)Illumina平台测序仪进行测序。

2)对测序结果进行拆分及校正,并进行测序数据质控;

3)将测序结果文件比对到人类基因组参考序列hg19/GRCh37,分析数据目标区域的覆盖度情况,对测序数据进行质控;

4)对目标区域的SNP、CNV及SV进行检测;

所述变异结果注释及解读模块用于执行如下:

1)根据ClinVar、1000G、HGMD、ClinGen、dbVar、gnomAD数据库,对检测到的SNP及INDEL、CNV和SV进行注释,分析突变对多囊肾疾病的致病性;

2)依据ACMG指南标准,对突变进行人工解读,筛选出致病突变,并根据致病性结果出具检测报告。

本申请还提供一种多囊肾疾病检测系统,其特征在于,包括建库模块,所述建库模块用于执行上述建库步骤,同时还包括测序和分析模块,所述分析模块用于分析如下:

1)根据ClinVar、1000G、HGMD、ClinGen、dbVar、gnomAD等数据库,使用vep v96、transvar v2.4.0和AnnotSV v2.2分别对检测到的SNP及INDEL、CNV和SV进行注释,分析突变对多囊肾疾病的致病性。

2)依据ACMG等指南标准,对突变进行人工解读,筛选出致病突变,并根据致病性结果出具检测报告。

与现有技术相比,本申请至少具有如下优势:

1)本申请首次巧妙结合TELL-Seq技术和探针捕获技术,实现多囊肾疾病的有效测序检测。TELL-Seq技术中通过index序列避免了同源区域对目标序列的干扰,同时使用特定blocker封闭接头提高杂交捕获效率,降低测序成本;

2)本本申请通过探索,选择了捕获PKD1及PKD2基因的全长,和捕获PKHD1、

ALG8、ALG9、ANKS6、COL4A3、COL4A4、COL4A5、COL4A6、DNAJB11、DZIP1L、FLCN、GANAB、HNF1B、LRP5、MYH9、TSC1、TSC2、VHL基因的全编码区及可变剪切区区域(外显子向内含子外延20bp),保证了检测的全面性;并对探针序列进行优化,实验证明其检测全面、准确度高,能够实现多囊肾疾病的有效测序检测;

3)本申请使用TELL-Seq技术加特定blockers封闭及目标区域捕获,解决了多囊肾疾病相关的PKD1与PKD2基因区域内同源性高、GC含量高导致的测序分析困难,降低了成本并提高了检测效率和准确性。

附图说明

为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1、PKD1基因与其假基因之间的同源性;

图2、本申请整体分析流程图;

图3、第一例样本PKD1基因Insert位点一代验证结果;

图4、第二例样本PKD1基因SNP位点一代验证结果;

图5、第三例样本PKD1基因第一个SNP位点一代验证结果;

图6、第三例样本PKD1基因第二个SNP位点一代验证结果;

图7、第一例样本LRP5基因致病位点原始数据可视化结果;

图8、第二例样本PKHD1基因致病位点原始数据可视化结果;

图9、第三例样本PKHD1基因致病位点原始数据可视化结果;

图10、PKD-1样本PKD1基因MLPA验证结果;

图11、PKD-5样本PKD1基因MLPA验证结果。

具体实施方式

下面将结合附图对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

以下术语或定义仅仅是为了帮助理解本申请而提供。这些定义不应被理解为具有小于本领域技术人员所理解的范围。

除非在下文中另有定义,本申请具体实施方式中所用的所有技术术语和科学术语的含义意图与本领域技术人员通常所理解的相同。虽然相信以下术语对于本领域技术人员很好理解,但仍然阐述以下定义以更好地解释本申请。

如本申请中所使用,术语“包括”、“包含”、“具有”、“含有”或“涉及”为包含性的(inclusive)或开放式的,且不排除其它未列举的元素或方法步骤。术语“由…组成”被认为是术语“包含”的优选实施方案。如果在下文中某一组被定义为包含至少一定数目的实施方案,这也应被理解为揭示了一个优选地仅由这些实施方案组成的组。

在提及单数形式名词时使用的不定冠词或定冠词例如“一个”或“一种”,“所述”,包括该名词的复数形式。

本申请中的术语“大约”、“大体”表示本领域技术人员能够理解的仍可保证论及特征的技术效果的准确度区间。该术语通常表示偏离指示数值的±10%,优选±5%。

此外,说明书和权利要求书中的术语第一、第二、第三、(a)、(b)、(c)以及诸如此类,是用于区分相似的元素,不是描述顺序或时间次序必须的。应理解,如此应用的术语在适当的环境下可互换,并且本申请描述的实施方案能以不同于本申请描述或举例说明的其它顺序实施。

本申请所述的用于多囊肾疾病基因测序的文库构建方法如附图2的模块1所示,该方法是利用blocker封闭TELL-Seq接头序列,再通过探针捕获目标区域进行NGS测序,从而达到高深度测序来识别多囊肾疾病相关基因的单点突变、拷贝数变异和结构变异检测。为避免PKD1基因高同源性区域假基因的影响,并能够保证目标区域全部被覆盖,本方法基于TELL-Seq,先在DNA序列中加入index序列,再进行打断并使用探针集对PKD1、PKD2基因的全长以及PKHD1、ALG8、ALG9、ANKS6、COL4A3、COL4A4、COL4A5、COL4A6、DNAJB11、DZIP1L、FLCN、GANAB、HNF1B、LRP5、MYH9、TSC1、TSC2、VHL基因的CDs区进行捕获,捕获时加入特定的blocker封闭接头序列以提高捕获效率,再通过Illumina测序平台进行测序,使用可以识别Index的方法比对到参考序列,再通过生物信息分析获得SNP、INDEL、CNV和SV的突变情况,并注释获得其致病信息。

本申请所述的blocker是一种基于碱基互补配对原理与接头序列相结合,避免探针与接头的非特异性结合,确保探针与目的片段的特异性结合,从而提高目的片段的杂交捕获效率。基于本申请中较长的index序列(18bp),一些通用的blocker并不能起到有效的封闭效果(只针对6-8bp的index有封闭作用),导致捕获效率低。本申请所述的特殊blocker针对较长的index序列,设计与长index序列能够互补配对结合的blocker序列,起到有效的封闭作用,降低接头间的非特异性结合,以此提高测序读长的中靶率、增加富集深度。

在一些实施方式中,本申请所采用的用于多囊肾疾病基因测序的文库构建方法如下:

1)对样本DNA添加index;2)使用blocker对index进行封闭处理;3)加入捕获探针对目标区域进行捕获;4)文库洗脱和PCR扩增;5)文库纯化和定量。在一些实施方式中,所述1)是基于TELL-Seq技术对样本DNA添加index。

不作限制,本申请在一些实施方式中,所述2)中blocker为能够与18bp接头序列特异性互补结合的blocker序列。在一些实施方式中,所述3)中捕获探针是针对基因PKD1、PKD2全长的探针,和针对基因PKHD1、ALG8、ALG9、ANKS6、COL4A3、COL4A4、COL4A5、COL4A6、DNAJB11、DZIP1L、FLCN、GANAB、HNF1B、LRP5、MYH9、TSC1、TSC2和VHL全编码区及可变剪切区的探针。在一些实施方式中,所述探针序列如SEQ ID NO.1-227所示。在一些具体实施方式中,所述方法可具体包括如下步骤:1)基于TELL-Seq技术对样本DNA添加index:2)使用blockers对index进行封闭处理:在步骤1的文库中加入blocker,混匀并通过PCR杂交程序进行杂交反应;3)加入捕获探针对目标区域进行捕获:混合DNA模板与所需试剂离心混匀,并通过PCR杂交程序进行杂交反应;4)文库洗脱和PCR扩增:使用链霉亲和素磁珠清洗、捕获,将链霉亲和素磁珠加入到杂交体系中,混匀孵育后完成洗脱;文库中加入PCR反应液,按标准PCR反应条件进行PCR扩增。5)文库纯化和定量。

为进一步实现多囊肾疾病检测目的,本申请具体的多囊肾疾病检测方法,包括了上述文库构建方法,并进一步包含如下步骤:

测序及数据分析步骤和变异结果注释及解读步骤;

在一些实施方式中,所述测序及数据分析步骤包括:

1)Illumina平台测序仪进行测序。

2)对测序结果进行拆分及校正,并进行测序数据质控;

3)将测序结果文件比对到人类基因组参考序列hg19/GRCh37,分析数据目标区域的覆盖度情况,对测序数据进行质控;

4)对目标区域的SNP、CNV及SV进行检测;

在一些实施方式中,所述变异结果注释及解读步骤包括:

1)根据ClinVar、1000G、HGMD、ClinGen、dbVar、gnomAD数据库,对检测到的SNP及INDEL、CNV和SV进行注释,分析突变对多囊肾疾病的致病性;

2)依据ACMG指南标准,对突变进行人工解读,筛选出致病突变,并根据致病性结果出具检测报告。

实验例、本申请多囊肾疾病的基因检测方法建立

本申请的多囊肾疾病的基因检测的整体实验流程如图2所示,具体的:

一、文库构建与探针捕获测序:

1、按TELL-Seq技术标准方法进行添加index的文库构建:

1)标码DNA:

a.使用5ng DNA,强烈震荡TELL Bead至少30秒,离心不超过1秒以使溶液重回底部,使用200ul墙头反复吹打溶液5次,确保所有磁珠混合均匀;

b.在0.2ml PCR微管中加入5x Reaction Buffer 8ul,无核酸酶的水30ul,Cofactor 8ul,TELL Bead 12ul,吹打混合均匀后离心1秒,再添加Barcoding Enzyme 4ul,吹打混匀;

c.使用宽孔枪头添加Suspension Buffer 6ul,缓慢吹打混匀,35℃缓慢旋转培养15分钟;

2)稳化DNA:加入2ul稳定剂,缓慢吹打混匀,继续35℃缓慢旋转培养30分钟;

3)酶法片段化DNA:加入标记酶和外切酶各2ul,吹打混匀,继续35℃培养10分钟;

4)清洗微珠:

a.将PCR置于磁性支架1分钟,溶液澄清后吸出丢弃上清液;

b.加入125ul洗涤液清洗,重新澄清溶液并丢弃上清;

c.加入80ul终止液,吹打悬浮后重新澄清,室温下孵育5分钟;

d.将PCR放回磁性支架1分钟,溶液澄清后吸出丢弃上清液;

e.加入125ul洗涤液,吹打混匀,转移到一个新的PCR管中,63℃孵育3分钟;

f.将PCR放回磁性支架1分钟,溶液澄清后吸出丢弃上清液;

g.重复d、e、f步骤一次;

h.加入20ul洗涤液,重新悬浮磁珠;

5)扩增文库:

a.激烈震荡10秒悬浮磁珠,快速离心1秒后吹打,使磁珠完全悬浮;

b.将PCR置于磁性支架1分钟,溶液澄清后吸出上清液,预留2ul;

c.加入无核酸酶的水10ul,2x PCR Master Mix 25ul,10x Primer I 5ul,10xPrimer II 5ul,Enhancer 3ul,吹打混匀后快速离心1秒;

d.进行PCR扩增,扩增后保存2ul产物用于质检;

6)清理文库:

a.将PCR置于磁性支架1分钟,溶液澄清后转移上清液至0.2ml PCR管中;

b.添加无核酸酶的水至100ul;

c.加入78ul AMPure XP,吹打混匀,室温孵育5分钟;

d.将PCR置于磁性支架1分钟,溶液澄清后吸出上清液,加入200ul 75%的乙醇,静止30秒,吸出并丢弃上清液;

e.重复步骤d一次,打开盖子1-2分钟挥发乙醇;

f.加入25ul TE缓冲液,吹打混匀再静置5分钟;

g.将PCR置于磁性支架1分钟,溶液澄清后转移23ul上清液至新管中;

7)质检和量检文库:对预留的2ul产物进行质检。

2、使用特定的blocker对index进行封闭处理:在步骤1的文库中加入blocker,吹打混匀并通过PCR杂交程序进行杂交反应。

3、加入探针对目标区域进行捕获:混合DNA模板与所需试剂,离心混匀,并通过PCR杂交程序进行杂交反应。

4、文库洗脱:使用链霉亲和素磁珠清洗、捕获,将链霉亲和素磁珠加入到杂交体系中,混匀、孵育后完成洗脱。

5、PCR扩增:文库中加入PCR反应液,按标准PCR反应条件进行PCR扩增。

6、文库纯化和定量:PCR扩增完成后,PCR管中加入纯化试剂进行纯化,并对文库进行定量和片段分布检测,纯化后的PCR产物可在-20℃保存一周。

二、测序及数据分析:

5)文库制备完成且质检合格后,使用Illumina平台测序仪进行测序,测序步骤按照现有操作规程进行。

6)使用tellread v1.0.3软件对测序结果进行拆分及校正,并进行测序数据质控。

7)使用EMA v0.6.2软件,将测序结果文件比对到人类基因组参考序列(hg19/GRCh37)得到BAM文件,使用bamdst软件分析数据目标区域的覆盖度情况,对测序数据进行质控。

8)使用Sentieon软件driver模块对目标区域的SNP、CNV及SV进行检测。

三、变异结果注释及解读

3)根据ClinVar、1000G、HGMD、ClinGen、dbVar、gnomAD等数据库,使用vepv96、transvar v2.4.0和AnnotSV v2.2分别对检测到的SNP及INDEL、CNV和SV进行注释,分析突变对多囊肾疾病的致病性。

4)依据ACMG等指南标准,对突变进行人工解读,筛选出致病突变,并根据致病性结果出具检测报告。

实施例1、本申请捕获探针集的设计和优化过程

1、探针靶向基因和靶向区域的设计

本领域清楚,PKD1和PKD2基因突变类型各异,包括错义突变、无义突变、剪接异常突变、插入和/或缺失、复杂重排等;而且分布于基因不同位置,无突变热点;同时PKD1基因第1-33外显子存在6个序列高度相似的假基因,同源性高达97.7%(见图1),且大约80%的致病突变发生在此区域;另外,基因空间结构复杂,部分区域GC含量高达70%-80%。这些都给ADPKD患者的遗传学分析带来了具大的困难与挑战。本申请经过探索,选择针对PKD1与PKD2基因的全长进行靶向捕获探针集设计,同时还针对PKHD1、ALG8、ALG9、ANKS6、COL4A3、COL4A4、COL4A5、COL4A6、DNAJB11、DZIP1L、FLCN、GANAB、HNF1B、LRP5、MYH9、TSC1、TSC2、VHL基因的全编码区及可变剪切区区域(外显子向内含子外延20bp)进行靶向捕获捕获探针集设计,有效解决了上述外显子数目多、没有突变热点、基因组内存在复杂区域等检测问题。

2、捕获探针序列的设计和优化

进一步的,本实施选用临床诊断为多囊肾阳性样本,使用初步设计的捕获探针集进行目标区域捕获并通过Illumina测序平台进行测序,分析测序结果中PKD1与PKD2基因全长以及PKHD1、ALG8、ALG9、ANKS6、COL4A3、COL4A4、COL4A5、COL4A6、DNAJB11、DZIP1L、FLCN、GANAB、HNF1B、LRP5、MYH9、TSC1、TSC2、VHL基因的全编码区及可变剪切区(外显子向内含子外延20bp)区域的覆盖度,评估捕获探针集的捕获效率。操作流程如下:

1)按常规流程进行样本DNA的提取并进行片段化,片段化长度为150bp;

2)按本申请探针捕获与建库测序流程说明对步骤一所得的DNA进行捕获,并使用Illumina平台进行测序;

3)测序结果拆分后使用现有生信分析工具统计数据覆盖度信息,获得目标区域覆盖度结果。

目标区域各基因覆盖度结果:PKD1基因4X覆盖度为53%,PKD2基因没有覆盖,ALG9、ALG8、COL4A6、LRP5和COL4A4基因都没有完全覆盖,具体参见表1。

表1.捕获探针集优化过程中覆盖度检测结果

上述表明本此探针集捕获效率偏低,需对探针设计进一步优化。本申请优化过程包括:对未覆盖的基因区域重新设计捕获探针,根据探针的结合能力调整探针比例,对结合能力弱的探针进行补偿,以提高捕获的覆盖度与均一性。

示例性的,对结合能力弱的探针进行补偿:针对上述表1中,ALG9基因的exon1至exon5区域,探针捕获效率低,没有覆盖的部分,经下面调整后,增加了探针序列SEQ IDNO.44-47从而实现全面覆盖;针对基因ALG8的exon13区域,增加了探针序列SEQ ID NO.32从而实现全面覆盖;针对基因COL4A6的exon24区域,增加了探针序列SEQ ID NO.170从而实现全面覆盖;针对基因LRP5的exon8区域,增加了探针序列SEQ ID NO.30从而实现全面覆盖;针对基因COL4A4的exon43区域,增加了探针序列SEQ ID NO.63从而实现全面覆盖。

经调整后,使用优化后的捕获探针集进行目标区域捕获并通过Illumina测序平台进行测序,分析测序结果中PKD1与PKD2基因全长以及PKHD1、ALG8、ALG9、ANKS6、COL4A3、COL4A4、COL4A5、COL4A6、DNAJB11、DZIP1L、FLCN、GANAB、HNF1B、LRP5、MYH9、TSC1、TSC2、VHL基因的全编码区及可变剪切区(外显子向内含子外延20bp)区域的覆盖度,评估捕获探针集的捕获效率,具体操作流程同上。

表2为优化后的结果,PKD1基因exon1部分区域由于同源性高达100%,4X覆盖度为54%,另有部分intro区域没有覆盖,整体覆盖度为99%;PKD2基因部分intro区域没有覆盖,整体覆盖度为99%,其他基因4X覆盖度全部为100%,表明本申请探针集捕获效率较好。

表2本申请的捕获探针集捕获样本目标区域覆盖度结果。

本实施例最终获得用于本申请的探针集,具体序列如SEQ ID NO.1-227所示,参见下表3。

表3、优化后的探针序列

实施例2、基于TELL-Seq/Blocker的靶向捕获技术优化

1、基于TELL-Seq靶向捕获的探索

TELL-Seq是一种用于全基因组文库制备的技术,具体是使用一种转座酶来片段化DNA并添加条形码,进而帮助测序后重新组装这些reads。TELL-Seq试剂盒可用于连接伪长reads,平均50kb,最大100kb,能够有效地避免同源序列的干扰。但是,这种全基因组测序成本高,为了节约成本,并能快速、高效的完成检测,本申请对TELL-Seq文库进行改良,对目标区域进行了探针捕获,即具体应用到多囊肾疾病基因突变的探针捕获检测中。

2、基于blocker封闭index的优化

考虑到使用探针捕获时index的封闭效果与捕获效率有很大关系,TELL-Seq技术index序列长度达18bp,远长于常规6-8bp的index序列,因此使用常规blocker的封闭技术并不能有效封闭TELL-Seq的index序列,会导致捕获效率低。本实施例探寻使用特定的blocker可以有效识别长index序列,对TELL-Seq的index序列实现有效的封闭效果。再利用探针捕获技术,根据碱基杂交互补配对原理捕获目标区域,实现对目标区域的高效捕获。具体的:

选用1例临床诊断为多囊肾阳性样本,使用TELL-Seq技术建库,再使用常规blocker封闭index序列后使用优化后的捕获探针集进行目标区域捕获并通过Illumina测序平台进行测序,分析测序结果中目标区域的reads数占测序reads总数的百分比,评估blocker封闭效果。操作流程如下:

1)按TELL_Seq技术进行样本建库;

2)按常规blocker封闭index序列后使用优化后的捕获探针集对步骤一的文库进行目标区域捕获,通过Illumina测序平台进行测序;

3)测序结果使用tell-read软件拆分校正后使用现有bamdst软件统计目标区域的reads数占测序reads总数的百分比,评估blocker封闭效果。

Blocker评估结果:表4所示,使用TELL-Seq技术后目标区域捕获的reads仅有0.70%,表明常规blocker对TELL-Seq使用的index不能起到有效的封闭作用,需要进一步优化。

表4blocker封闭index序列优化过程中捕获效率结果。

由此可见,TELL-Seq技术使用的index序列较长,常规的blocker不能起到有效地封闭效果。因此,我们针对此index序列设计并合成特定的blocker,对index序列进行封闭处理,该特定blocker为能够与18bp接头序列特异性互补结合,避免了探针与接头的非特异性结合,确保探针与目的片段的特异性结合,从而对长index序列起到有效的封闭作用,提高目的片段的杂交捕获效率。

使用特定的blocker封闭index序列后,使用优化后的捕获探针集进行目标区域捕获并通过Illumina测序平台进行测序,分析测序结果中目标区域的reads数占测序reads总数的百分比,评估blocker封闭效果。操作流程同上。

从表5可知,使用特定的blocker封闭TELL-Seq建库后的index序列,探针捕获到目标区域的reads可以达到36.69%,优化后的blocker对TELL-Seq使用的index能起到有效的封闭作用,相比于上述常规blocker,效果优势非常明显。

表5特定的blocker封闭index序列后捕获效率结果

实施例3、基于SNP与INDEL变异检测的准确性验证

选用3例临床诊断为多囊肾疾病且含有相关基因突变的临床样本,使用本申请中TELL-Seq技术建库,通过特定的blocker封闭index序列后使用捕获探针集进行目标区域捕获,并通过Illumina测序平台进行测序,检测测序结果中PKD1与PKD2基因全长以及PKHD1、ALG8、ALG9、ANKS6、COL4A3、COL4A4、COL4A5、COL4A6、DNAJB11、DZIP1L、FLCN、GANAB、HNF1B、LRP5、MYH9、TSC1、TSC2、VHL基因的全编码区及可变剪切区(外显子向内含子外延20bp)区域的变异位点,对变异位点进行注释,筛选致病突变位点并进行一代测序验证,评估本申请探针捕获测序数据分析的准确率。操作流程如下:

1)按常规DNA提取步骤进行样本DNA的提取;

2)按本申请文库构建与探针捕获测序流程说明对步骤一所得的DNA进行TELL-Seq建库、blocker封闭index序列和探针捕获,并使用Illumina平台进行测序;

3)测序结果拆分后,使用EMA v0.6.2软件,将测序结果文件比对到人类基因组参考序列(hg19/GRCh37)得到BAM文件,使用Sentieon软件driver模块对目标区域的SNP和INDEL进行检测;

4)根据ClinVar、1000G、HGMD、ClinGen、dbVar、gnomAD等数据库,使用vep v96对检测到的SNP及INDEL进行注释,分析突变对多囊肾疾病的致病性,筛查致病位点。

5)对PKD1基因区域的致病突变位点进行一代验证,其他基因的致病位点通过IGV查看原始数据进行校验,从而判断使用本申请进行测序分析结果的准确性。

3例样本目标区域变异检测结果如表6和图3-9所示:其中一例样本在PKD1基因上有1个致病性Insert位点,另外两例样本在PKD1基因上分别有1个和2个致病性SNP位点,通过一代测序验证,上述变异均真实存在;3例样本在PKD1基因之外的其他区域各有一个致病SNP位点,通过IGV查看原始bam文件,SNP结果也真实存在,表明使用本申请的方法进行捕获测序分析SNP与INDEL,检测结果准确可靠。

表6本申请的捕获探针集捕获样本目标区域覆盖度结果。

实施例4、基于CNV检测的准确性验证

选用2例临床诊断为多囊肾疾病且含有相关拷贝数变异的临床样本,使用本申请中的TELL-Seq技术建库,通过特定的blocker封闭index序列后使用捕获探针集进行目标区域捕获,并通过Illumina测序平台进行测序,检测测序结果中PKD1与PKD2基因全长以及PKHD1、ALG8、ALG9、ANKS6、COL4A3、COL4A4、COL4A5、COL4A6、DNAJB11、DZIP1L、FLCN、GANAB、HNF1B、LRP5、MYH9、TSC1、TSC2、VHL基因的全编码区及可变剪切区(外显子向内含子外延20bp)区域的CNV,同时对2例样本的PKD1基因区域进行MLPA验证,比较使用本申请进行分析的CNV结果与验证结果,评估本申请分析CNV的准确性。操作流程如下:

1)按常规DNA提取步骤进行样本DNA的提取;

2)按本申请文库构建与探针捕获测序流程说明对步骤一所得的DNA进行TELL-Seq建库、blocker封闭index序列和探针捕获,并使用Illumina平台进行测序;

3)测序结果拆分后,使用EMA v0.6.2软件,将测序结果文件比对到人类基因组参考序列(hg19/GRCh37)得到BAM文件,使用DECoN软件与panelcn软件对比对后的bam文件进行CNV检测,获得2例样本的CNV结果;

4)使用MLPA分析2例样本PKD1基因区域的CNV,对本申请的检测结果进行对比验证,从而判断使用本申请进行捕获测序分析CNV结果的准确性。

表7 DECoN软件对PKD1基因的CNV检测结果

表8 panelcn软件对PKD1基因的CNV检测结果

2例样本目标区域CNV检测结果(如表7-8,图10-11):使用DECoN软件分析,2例样本都在PKD1基因的3号外显子和与其相邻的一个内含子区域检测到缺失型CNV;使用panelcn软件分析2例样本中得到同样的结果;MLPA验证结果与检测结果一致,表明使用本申请的方法进行捕获测序分析CNV,检测结果准确可靠。

前述对本申请的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本申请限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本申请的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本申请的各种不同的示例性实施方案以及各种不同的选择和改变。本申请的范围意在由权利要求书及其等同形式所限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号