首页> 中国专利> 一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质

一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质

摘要

本申请公开了一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质,包括:靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取二十一个靶标基因序列;测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;reo‑hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,获得待测样本的致病性评价信息;报告生成步骤,包括根据所述reo‑hit解读步骤的结果,输出致病性评价报告。本申请仅通过二十一个基因的高通量测序panel完成遗传性主动脉疾病的相关基因检测,减少了遗传性主动脉疾病的基因检测成本,并且大大提高了遗传性主动脉疾病的疾病筛查效率。

著录项

  • 公开/公告号CN112592969A

    专利类型发明专利

  • 公开/公告日2021-04-02

    原文格式PDF

  • 申请/专利权人 深圳瑞奥康晨生物科技有限公司;

    申请/专利号CN202011631464.4

  • 发明设计人 罗宏敏;吴莉萍;辜清泉;杨旭;

    申请日2020-12-31

  • 分类号C12Q1/6869(20180101);G16B40/00(20190101);G16B20/20(20190101);G16B50/30(20190101);

  • 代理机构44281 深圳鼎合诚知识产权代理有限公司;

  • 代理人彭家恩;彭愿洁

  • 地址 518008 广东省深圳市盐田区海山街道深盐路2002号大百汇高新技术工业园A栋907

  • 入库时间 2023-06-19 10:27:30

说明书

技术领域

本申请涉及遗传性主动脉疾病基因检测领域,具体涉及一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质。

背景技术

遗传性主动脉疾病以主动脉扩张、主动脉瘤/夹层为特征,可发生于马凡综合征(MFS)、Loeys-Dietz综合征(LDS)、血管型Ehlers-Danlos综合征(vEDS)、家族性胸主动脉瘤/夹层(FTAAD)等多种疾病。这些疾病有着不同程度的临床表型重合,异质性高,诊断和筛查都很困难,尤其是早期发病期。遗传性主动脉疾病是明确的单基因遗传病,可以采用基因检测手段,在未发病或发病早期筛查出携带者,实现早期管理。

但是,当前产界缺少单独对遗传性主动脉疾病的基因检测手段,大部分是将其包括在数百个基因的高通量测序panel上,因而遗传性主动脉疾病的检测手段成本过高,不适用于大规模人群筛查。

如何简化遗传性主动脉疾病致病基因的检测方法,降低检测成本,以使其适应大规模人群是遗传性主动脉疾病筛查的难点。

发明内容

本申请的目的是提供一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质,以适用于大规模人群的遗传性主动脉疾病筛查。

为了实现上述目的,本申请采用了以下技术方案:

本申请的第一方面公开了一种遗传性主动脉疾病及相关基因的检测方法,其特征在于,包括:

靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;

测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;

reo-hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;

报告生成步骤,包括根据reo-hit解读步骤的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。

需要说明的是,本申请的关键在于通过reo-hit解读系统将遗传性主动脉疾病二十一个致病基因的高通量测序数据中变异特征的50个评价参数自动转化为ACMG指南的28项评价参数,进而得到遗传性主动脉疾病致病性评价,实现了仅通过二十一个基因的高通量测序panel完成遗传性主动脉疾病的相关基因检测,单独对遗传性主动脉疾病基因的致病性进行评价,从而减少了遗传性主动脉疾病的基因检测成本,并且大大提高了遗传性主动脉疾病的疾病筛查效率。

本申请的一种实现方式中,二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列。

本申请的一种实现方式中,高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%。

本申请的一种实现方式中,人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库;

优选的,疾病数据库包括OMIM数据库和CGD数据库;

优选的,变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;

优选的,致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmm MKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100way vertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种;

优选的,reo-hit解读步骤还包括采用GWAS-catalog数据库进行补充注释。

本申请的第二方面还公开了一种用于遗传性主动脉疾病及相关基因检测的多重PCR引物,多重PCR引物用于扩增FBN1、TGFBR1、TGFBR2、SMAD3、TGFB2、TGFB3和SKI,七个靶标基因序列。

本申请的一种实现方式中,多重PCR引物覆盖七个靶标基因的外显子区及其剪切位点外延至少15bp的序列。

本申请的第三方面还公开了一种遗传性主动脉疾病及相关基因的检测装置,包括靶标序列获取模块、测序模块、reo-hit解读模块、报告生成模块,

靶标序列获取模块,包括用于通过PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;

测序模块,包括用于对获取的二十一个靶标基因序列进行高通量测序;

reo-hit解读模块,包括用于根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;

报告生成模块,包括用于根据reo-hit解读模块的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。

本申请的一种实现方式中,二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列;

优选的,高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%;

优选的,人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库;

优选的,疾病数据库包括OMIM数据库和CGD数据库;

优选的,变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;

优选的,致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmm MKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100way vertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种;

优选的,reo-hit解读步骤还包括采用GWAS-catalog数据库进行补充注释。

本申请的第四方面还包括一种遗传性主动脉疾病及相关基因的检测装置,装置包括存储器和处理器;

存储器,包括用于存储程序;

处理器,包括用于通过执行存储器存储的程序以实现上述遗传性主动脉疾病及相关基因的检测方法。

本申请的第五方面还公开了一种计算机可读存储介质,存储介质中存储有程序,程序能够被处理器执行以实现上述遗传性主动脉疾病及相关基因的检测方法。

由于采用以上技术方案,本申请的有益效果在于:

本申请通过reo-hit解读系统将遗传性主动脉疾病二十一个致病基因的高通量测序数据中变异特征的50个评价参数自动转化为ACMG指南的28项评价参数,进而得到遗传性主动脉疾病致病性评价,实现了仅通过二十一个基因的高通量测序panel完成遗传性主动脉疾病的相关基因检测,并单独对遗传性主动脉疾病基因的致病性进行评价,减少了遗传性主动脉疾病的基因检测成本,并且大大提高了遗传性主动脉疾病的疾病筛查效率。

附图说明

图1为本申请实施例提供的一种遗传性主动脉疾病及相关基因的检测方法的流程框图;

图2为本申请实施例中提供的一种遗传性主动脉疾病及相关基因的检测装置的结构框图。

具体实施方式

下面通过具体实施方式对本申请作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。

另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。

如图1所示,本实施例提供了一种遗传性主动脉疾病及相关基因的检测方法,包括以下步骤,

S201、靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;

具体地,具体地,待测样本可以为血液或口腔拭子采集的口腔黏膜细胞,待测样本的基因组序通过对待测样本进行DNA提取得到。本实施例DNA提取的方式可以采用本领域常规的方式进行提取,在此不作特别限制。本实施例根据遗传性主动脉疾病的二十一个致病基因ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,设计多重PCR引物对和探针,对待测样本的基因组序列进行多重PCR扩增,以获取待测样本中遗传性主动脉疾病相关的二十一个靶标基因序列,用于后续进行高通量测序。本实施例的一种实现方式中,多重PCR扩增的退火温度范围从55摄氏度到70摄氏度,循环数范围在25-35个循环。本实施例的一个实现方式中,二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列。

S202、测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;

对扩增后的基因序列进行高通量测序,从而获得待测样本关于上述二十一个致病基因的高通量测序数据,并对高通量测序数据进行变异检测以获取待测样本的变异特征。本实施例的一种实现方式中,高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%。

具体地,由于测序后原始下机数据中包含接头(adapter)序列、测序质量很低的碱基、未测出的碱基(以N表示),会对后续的reo-hit解读造成很大的干扰,因而首先对原始下机数据进行过滤得到高质量的数据(clean data或clean reads),而后使用比对软件BWA(Burrows-Wheeler Aligner)将每个样本的clean data比对到人的参考基因组(GRCh37),得到BAM格式的比对结果文件。基于比对结果,去除PCR重复reads,用GATK对BAM格式的数据进行变异检测和过滤以获得样本测序数据的变异特征。

S203、reo-hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;

具体地,所述人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库,用于提供更多的频率信息;所述疾病数据库包括OMIM数据库和CGD数据库;所述变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;所述致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmmMKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100wayvertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种,不同软件的预测算法各有不同,互为补充,能更综合地预测变异的致病性。

人类频率数据库、疾病数据库、变异数据库用于提供ACMG证据集,预测致病性软件用于找出符合ACMG证据定义的变异特征并高亮显示,进而进行综合分析以对变异特征进行注释,每个变异特征采集50个评价参数,再将50个评价参数自动转化为ACMG指南的28项评价参数,根据ACMG指南的28项评价参数生成遗传性主动脉疾病致病性评价。

具体地,50个评价参数包括变异基本信息、功能注释、频率信息、基因与疾病关联以及变异与疾病关联等信息,其中,变异基本信息包括染色体位置,碱基变化,发生变异的基因;功能注释包括错义突变,剪切突变,移码突变等;频率信息包括1000genome,ExAC,EVS,In-house等数据库提取的变异频率数据;基因与疾病关联用于说明根据CGD数据库和OMIM数据库报道,基因能够造成什么疾病;变异与疾病关联用于说明根据OMIM,clinvar,HGMD报道,该变异能够造成什么疾病。

进一步,以ACMG指南中PVS1、PS1、PS2、PS3、PS4、PM1、PM2、PM3、PM4、PM5、PM6、PP1、PP2、PP3、PP4、PP5、BA1、BS1、BS2、BS3、BS4、BP1、BP2、BP3、BP4、BP5、BP6、BP7,28个证据定义的规则,将上述50个评价参数自动转化为ACMG指南的28项评价参数。

例如,对于人群频率为0的变异特征,根据ACMG指南的PM2证据的定义,可以得到ACMG PM2评价参数:本变异为极罕见变异,在1000genome数据库,ExAC数据库,EVS数据库,及自有数据库中均无记载;对于功能注释为移码突变的变异特征,根据ACMG指南的PVS1证据的定义:某些类型的变异(如无义突变,移码突变,±2以内的剪切位点突变,起始密码子突变,单个或多个外显子删除)通常被假定为完全造成基因产物的缺失,导致基因功能的中断,可以得到ACMG PVS1评价参数:本变异通常被假定为完全造成基因产物的缺失,导致基因功能的中断。

本实施例的一种实现方式中,对ACMG中模糊的、难以生成自动化评价参数的规则,例如,PS1:有报道同一位置相同氨基酸的改变是一个明确的致病变异,显示本变异也是致病变异的可能性较大;PS4:对该疾病的群体研究显示,本变异在病人群体中的频率,要显著高于正常人群体中的频率;PM5:有报道同一位置不同氨基酸的改变是一个明确的致病变异,显示本变异有一定的可能性也是致病变异;PP2:本变异是个错义突变,已知错义突变是该基因的一种普遍致病机制,且在基因上的错义突变良性率较低;BS1:在人群频率数据库中搜索本变异,与目标疾病的致病变异期望频率比较,当本变异的人群频率大于致病变异期望频率,可能表示本变异不是致病变异;reo-hit解读步骤也能够通过ClinicalSequencing Exploratory Research Consortium 9个实验室的解读实操经验定义ACMG证据,自动化生成相应的ACMG指南的评价参数。例如,ACMG的PP2证据:本变异是个错义突变,已知错义突变是该基因的一种普遍致病机制,且在基因上的错义突变良性率较低,然而如何定义PP2证据,ACMG指南中没有做更多的解释,本实施例中的reo-hit解读步骤将PP2证据定义为该基因上60%以上错义突变是恶性的,从而实现根据该证据的定义自动生成相应的ACMG指南的评价参数。

本实施例的一种实现方式中,所述reo-hit解读步骤还包括采用GWAS-catalog数据库进行补充注释,例如,对PS4证据:对该疾病的群体研究显示,本变异在病人群体中的频率,要显著高于正常人群体中的频率,进行自动化补充注释。

S204、报告生成步骤,包括根据reo-hit解读步骤的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。

具体地,根据患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数等模块生成遗传性主动脉疾病相关基因检测报告。本实施例的一种实现方式,可以根据需求对报告的不同模块选择添加或删减,以向用户提供更简要的报告信息。

本实施例实现了仅通过二十一个基因的高通量测序panel完成遗传性主动脉疾病的相关基因检测,单独对遗传性主动脉疾病基因的致病性进行评价,从而减少了遗传性主动脉疾病的基因检测成本,并且大大提高了遗传性主动脉疾病的疾病筛查效率。

本实施例的还提供了一种用于遗传性主动脉疾病及相关基因检测的多重PCR引物,所述多重PCR引物用于扩增FBN1、TGFBR1、TGFBR2、SMAD3、TGFB2、TGFB3和SKI,七个靶标基因序列,其中,每个靶标基因序列包括若干个扩增片段,多重PCR引物的序列及其扩增片段具体如表1所示:

表1

本实施例的一种实现方式中,所述多重PCR引物覆盖七个靶标基因的外显子区及其剪切位点外延至少15bp的序列。

本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。

因此,如图2所示,本申请一实施例中,遗传性主动脉疾病及相关基因的检测装置,包括:靶标序列获取模块301、测序模块302、reo-hit解读模块303、报告生成模块304。

具体地,靶标序列获取模块301,包括用于通过PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;本实施例的一种实现方式中,二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列。

测序模块302,包括用于对获取的二十一个靶标基因序列进行高通量测序;本实施例的一种实现方式中,高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%。

reo-hit解读模块303,包括用于根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;本实施例的一种实现方式中,人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库;疾病数据库包括OMIM数据库和CGD数据库;变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmm MKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100way vertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种。

本实施例的一种实现方式中,reo-hit解读模块还包括GWAS-catalog数据库,用以进行补充注释。

报告生成模块304,包括用于根据reo-hit解读模块的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。

本申请另一实施例还提供一种遗传性主动脉疾病及相关基因的检测装置,包括:存储器,用于存储程序;处理器,用于通过执行上述存储器存储的程序以实现如下方法:靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;reo-hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;报告生成步骤,包括根据reo-hit解读步骤的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。

本申请另一种实施例还提供一种计算机可读存储介质,包括程序,该程序能够被处理器执行以实现如下方法:靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;reo-hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;报告生成步骤,包括根据reo-hit解读步骤的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。

下面通过具体实施例对本申请作进一步详细说明。以下实施例仅对本申请进行进一步说明,不应理解为对本申请的限制。

实施例1

获取一主动脉病人血液样本,已知受检者临床主诉类马凡氏综合症,有动脉瘤,手指骨骼细长,存在家族史,但不排除Loeys-Dietz综合症。受检者血液样本经过基因组DNA提取和纯化后,构建基因组文库,经多重PCR引物对ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,21个靶标基因的编码区以及相邻的内含子区域(15bp)进行扩增,并通过NGS高通量测序仪测序获得测序数据,其中,测序覆盖度结果如表1所示:

表1

测序数据采用BWA工具与人类参考序列GRCh37比对,采用GATK流程检测变异,获取变异信息,在受检者TGFBR2基因上发现一个疑似致病错义突变,突变发生在6号外显子区发。进一步,基于上述变异信息,根据人类频率数据库、疾病数据库、变异数据库和致病性预测软件采集50个评价参数,得到对TGFBR2基因变异注释的评价参数具体如表2所示:

表2

由此可知,本次检测在受检者TGFBR2基因上发现杂合突变c.1427C>T,属于错义突变,突变导致第476位氨基酸由丙氨酸变成缬氨酸,进而导致蛋白功能的改变。进一步,根据ACMG指南定义的规则将上述对TGFBR2基因变异注释的评价参数自动转化为ACMG指南的评价参数,具体包括:

ACMG PM1:本变异处在一个致病变异的热点区域,或在一个研究完善的功能区域未发现良性变异。这表示该区域功能极为重要,处在该区域的变异为恶性变异的可能性高;

ACMG PM2:该变异为极罕见变异,在1000genome东亚数据库,ExAC东亚数据库及自有数据库中均无记载,极为罕见是致病变异的一种特征;

ACMG PP3:使用PolyPhen2和SIFT等多种软件对本变异进行蛋白功能预测,一致预测本变异可能是有害的变异;

ACMG PM5:有报道同一位置不同氨基酸的改变是一个明确的致病变异显示本变异有一定的可能性也是致病变异;

ACMG PP4:该受检者的表型及家族史可能支持Loeys-Dietz综合症特征;

ACMG PP1:在多个家族成员中发现本变异与疾病存在共分离现象。

其中,ACMG PM1证据为中等致病证据,ACMG PM2证据为中等致病证据,ACMG PP3证据为弱致病证据,ACMG PM5证据为中等致病证据,ACMG PP4证据为弱致病证据,ACMG PP1证据为弱致病证据。综合以上ACMG证据,判定该变异为疑似致病突变。

由于在受检者的马凡氏综合症所属FBN1基因中,未发现变异,在TGFBR2基因中,发现了错义突变c.1427C>T(p.Ala476Val),符合致病变异特征,而TGFBR2属于Loeys-Dietz综合症的致病基因,因此该受检者可诊断为Loeys-Dietz综合征,避免了马凡综合症的误诊。根据上述患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果和实验质控参数输出患者的遗传性主动脉疾病基因检测报告。

以上应用了具体个例对本申请进行阐述,只是用于帮助理解本申请,并不用以限制本申请。对于本申请所属技术领域的技术人员,依据本申请的思想,还可以做出若干简单推演、变形或替换。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号