首页> 中国专利> 一种对苯丙氨酸羟化酶基因进行测序的方法及试剂盒

一种对苯丙氨酸羟化酶基因进行测序的方法及试剂盒

摘要

本发明涉及基因工程领域,提供了一种对苯丙氨酸羟化酶基因进行测序的方法及试剂盒,该方法包括以下步骤:A.利用PAH基因特异性引物,对待测样品中的多个目标区域进行扩增,并基于扩增产物构建测序文库;B.对测序文库进行单分子扩增,得到与所述多个目标区域对应的多个单分子扩增产物;C.同时对所述多个单分子扩增产物进行高通量基因测序,得到所述多个目标区域的序列信息。该方法及试剂盒利用高通量测序技术对多个目标区域同时进行区域测序,提高了检测效率,同时还能提高检测的准确性和灵敏度,并能进一步同时对大量样品进行多区域检测。

著录项

  • 公开/公告号CN102533992A

    专利类型发明专利

  • 公开/公告日2012-07-04

    原文格式PDF

  • 申请/专利权人 盛司潼;

    申请/专利号CN201110445128.5

  • 发明设计人 盛司潼;

    申请日2011-12-27

  • 分类号C12Q1/68;

  • 代理机构

  • 代理人

  • 地址 518057 广东省深圳市南山区高新区科技中二路软件园二期11栋4楼北402室

  • 入库时间 2023-12-18 05:38:43

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-09-05

    专利实施许可合同备案的生效 IPC(主分类):C12Q 1/68 专利申请号:2011104451285 专利号:ZL2011104451285 合同备案号:X2023980039941 让与人:盛司潼 受让人:深圳市华因康高通量生物技术研究院 发明名称:一种对苯丙氨酸羟化酶基因进行测序的方法及试剂盒 申请日:20111227 申请公布日:20120704 授权公告日:20140507 许可种类:普通许可 备案日期:20230817

    专利实施许可合同备案的生效、变更及注销

  • 2014-05-07

    授权

    授权

  • 2012-09-05

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20111227

    实质审查的生效

  • 2012-07-04

    公开

    公开

说明书

技术领域

本发明涉及基因工程领域,更具体地说,涉及一种对苯丙氨酸羟化酶基 因进行测序的方法及试剂盒。

背景技术

苯丙氨酸羟化酶(phenylalanine hydroxylase,PAH)基因位于12号染色体 (12q22-12q24.1),大约由1.5Mb碱基组成,编码区包含13个外显子和12个内 含子,mRNA大小为1353bp,翻译成含451个氨基酸的酶单体。PAH基因的突 变具有以下特点:1.突变位置多变;2.突变类型多样。迄今已发现530种以上 的PAH基因突变类型,遍及所有的外显子,国内已发现30余种,其中60%以上 是错义突变。PAH是由肝脏产生的一种氨基酸代谢酶,催化苯丙氨酸变成酪 氨酸的反应,从而参与糖异生的过程,是细胞内苯丙氨酸代谢过程中必须的 酶。因此,对PAH基因进行测序,确定该样本中的PAH基因的序列,具有重 要的意义。

目前,对PAH基因进行测序的常见方法为Sanger测序法,通过Sanger测序 法能够对目标区域进行区域检测,但是Sanger测序法每次只能对一个样品的 PAH基因的某一段区域(不大于900bp)进行测序,检测效率低,测序成本高, 且由于sanger测序原理的限制,在检测带有杂合子的样品的信号时会出现双峰 乃至多峰,导致测序所得的测序峰图紊乱,甚至无法分析得到的序列信息, 测序失败。大量的研究已经证实,PCR产物直接测序法仅能于混合模板中检测 出比例≥20%的模板,且无法得出发生突变位点的精确变异比例。而现有技术 中基于Sanger测序法的试剂盒存在同样的缺陷。

因此,需要一种检测苯丙氨酸羟化酶基因的新方法和新试剂盒,能够同 时对PAH基因的多个区域进行区域检测,提高了检测效率,同时还能提高检 测的准确性和灵敏度,并能进一步同时对大量样品进行检测。

发明内容

本发明的目的在于提供一种对苯丙氨酸羟化酶基因进行测序的方法及试 剂盒,能同时对PAH基因的多个目标区域进行区域检测,提高了检测效率, 同时还能提高检测的准确性和灵敏度,并能进一步同时对大量样品进行检测。

本发明是这样实现的,一种对苯丙氨酸羟化酶基因进行测序的方法,包 括以下步骤:

A.利用PAH基因特异性引物,对待测样品中的多个目标区域进行扩增, 并基于扩增产物构建测序文库;

B.对测序文库进行单分子扩增,得到与所述多个目标区域对应的多个单 分子扩增产物;

C.同时对所述多个单分子扩增产物进行高通量基因测序,得到所述多个 目标区域的序列信息。

其中,所述步骤A包括以下步骤:

A1.利用PAH基因特异性引物,对待测样品中的多个目标区域进行扩增, 得到与所述多个目标区域对应的扩增产物;

A2.利用接头元件,与所述多个目标区域对应的扩增产物进行连接,得到 测序文库;所述接头元件采用平末端接头、突出末端接头、带茎环结构的接 头和分叉接头中的至少一种。

其中,步骤A2包括以下步骤:

A21.对与所述多个目标区域对应的扩增产物进行片段化,得片段化产物;

A22.利用接头元件,与片段化产物进行连接,构建测序文库。

步骤A所述的目标区域测序文库的长度无特殊限制,优选为25bp~500bp。 更优选为50bp~200bp,更优选为70bp~130bp。

其中,所述步骤A22包括以下步骤:

A221.利用第一接头与片段化产物的两端连接,得第一连接产物;

A222.环化第一连接产物,得环化产物;

A223.II s型限制性内切酶酶切环化产物,得酶切产物;

A224.在酶切产物两端接上第二接头和第三接头,得测序文库。

其中,所述步骤A22包括以下步骤:

A221’.利用第四接头与片段化产物连接,得第二连接产物;

A222’.II s型限制性内切酶酶切第二连接产物,得带有第四接头的酶切片 段;

A223’.带有第四接头的酶切片段与第五接头连接,形成测序文库。

其中,步骤A2所述接头元件中的至少一个接头包含有第一标签序列,用 于在文库构建过程中,对不同待测样品的测序文库进行标记。该第一标签序 列,优选为带有特定破基序列的核酸分子,其碱基数不限。

进一步的,该第一标签序列碱基数为3~20,更优选为4~10。

其中,步骤A所述的特异性引物与目标区域完全互补或部分互补。

进一步的,每个目标区域对应的特异性引物中,至少一条引物与该目标 区域部分互补,该部分互补的引物的5’端包含有第二标签序列。该第二标签序 列,用于在扩增目标区域过程中,对不同待测样品的目标区域扩增产物进行 标记。该第二标签序列,优选为带有特定碱基序列的核酸分子,其碱基数不 限。

进一步的,该第二标签序列碱基数为3~20,更优选为4~10。

其中,所述步骤A中同一样品的PAH基因的各目标区域的扩增,同时进行 或部分同时进行或分别独立进行。

其中,所述步骤A中的PAH特异性引物包括:SEQ ID NO:1和SEQ ID  NO:26,以及SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ  ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、 SEQ ID NO:20、SEQ ID NO:22和SEQ ID NO:24中的至少一条,SEQ ID NO:3、 SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、 SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23 和SEQ ID NO:25中的至少一条。

其中,步骤B所述的单分子扩增的方法为乳液PCR、桥式PCR中的至少一 种。

其中,步骤C所述的高通量测序技术为基于聚合酶的合成测序法或基于连 接酶的连接测序法。

本发明的还提供了一种能够用于本发明的任一种测序方法的试剂盒,本 发明是这样实现的,一种对苯丙氨酸羟化酶基因进行测序的试剂盒,包括:

PAH基因特异性引物,用于对待测样品中的多个目标区域进行扩增;

接头元件,用于与扩增产物结合构建测序文库。

其中,所述接头元件采用平末端接头、突出末端接头、带茎环结构的接 头和分叉接头中的至少一种。

其中,所述接头元件中的至少一个接头包含有第一标签序列,该第一标 签序列,用于在文库构建过程中,对不同待测样品的测序文库进行标记。该 第一标签序列优选为带有特定碱基序列的核酸分子,其碱基数不限,该第一 标签序列的碱基数优选为3~20。

其中,所述PAH基因特异性引物与目标区域完全互补或部分互补。

进一步的,每个目标区域对应的PAH基因特异性引物中,至少一条引物 与该目标区域部分互补,该部分互补的引物的5’端包含有第二标签序列,用于 在扩增目标区域过程中,对不同待测样品的目标区域扩增产物进行标记。该 第二标签序列优选为带有特定碱基序列的核酸分子,其碱基数不限,该第二 标签的碱基数优选为3~20,更优选为4~10。

其中,所述PAH基因特异性引物包括:SEQ ID NO:1和SEQ ID NO:26,以 及SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、 SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、 SEQ ID NO:22和SEQ ID NO:24中的至少一条,SEQ ID NO:3、SEQ ID NO:5、 SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、 SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23和SEQ ID NO:25 中的至少一条。

与现有技术相比,本发明的方法及试剂盒利用高通量测序技术对PAH基 因的多个目标区域同时进行深度测序,提高了检测效率,同时还能提高检测 的准确性和灵敏度,并能进一步对大量样品同时进行多区域测序。

附图说明

图1是本发明一个实施例中对PAH基因进行测序的方法流程图;

图2是本发明一个实施例中的单突出末端接头的结构示意图;

图3是本发明一个实施例中的双突出末端接头的结构示意图;

图4是本发明一个实施例中的带茎环结构的接头的结构示意图;

图5是本发明一个实施例中的分叉接头的结构示意图;

图6是本发明一个实施例中的T末端分叉接头的结构示意图;

图7是本发明另一个实施例中的分叉接头的结构示意图;

图8是本发明一个实施例中的双脱氧分叉接头的结构示意图;

图9是本发明一个实施例中利用片段化产物和接头元件构建测序文库的 方法流程图;

图10是本发明另一个实施例中利用片段化产物和接头元件构建测序文库 的方法流程图;

图11是本发明另一个实施例中利用片段化产物和接头元件构建测序文库 的方法流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及 实施例,对本发明进行进一步详细说明。

本发明所述的目标区域,为PAH基因上的任意序列,可根据需要进行选 择,包括但不限于基因的内部序列、基因的外部调控区域,所述基因的内部 序列,包括但不限于基因的内含子区域、外显子区域、同时含有内含子与外 显子的区域。

图1示出了本发明的一种对苯丙氨酸羟化酶基因进行测序的方法流程,该 方法包括以下步骤:

S1.利用PAH基因特异性引物,对待测样品中的多个目标区域进行扩增, 并基于扩增产物构建测序文库;

S2.对测序文库进行单分子扩增,得到与所述多个目标区域对应的多个单 分子扩增产物;

S3.同时对所述多个单分子扩增产物进行高通量基因测序,得到所述多个 目标区域的序列信息。

本方法通过高通量测序技术对待测样品的目标区域进行深度测序,该方 法能同时对PAH基因的多个目标区域进行检测,提高了检测效率,同时还能 提高检测的准确性和灵敏度,准确得到这些区域的序列信息,包括已知突变 和未知突变的各突变位点的变异情况,以及各突变位点发生变异的频率。此 外,通过控制各目标区域扩增产物的大小,可免去了片段化步骤,减少了实 验步骤,提高了实验效率,降低了成本。

通过本方法所得的序列信息,可用于各种科学研究,包括但不限于人群 序列分析、基因功能研究、蛋白功能研究。

需要说明的是:

步骤S1中所述待测样品为能提取核酸的任意形式的样品,包括但不限于: 全血、血清、血浆和组织样品;所述组织样品包括但不限于:石蜡包埋组织、 新鲜组织和冰冻切片。

步骤S1所得测序文库中,存在多种测序文库分子,对测序文库进行单分 子扩增,即是指,将测序文库中的多种文库分子,以极微量(甚至单分子) 的形式在空间上隔离(但这些文库分子整体上还是属于同一个反应体系), 并且在各自的空间内实现扩增,以提升各种分子在后续测序反应中的信号。

现有技术中,Sanger测序技术每次只能对一个样品的某一段区域进行测 序,要实现对多个目标区域的测序,只能是通过多次反应来实现。而在本发 明中,测序文库中的各个分子经过单分子扩增后,每个测序文库分子均形成 单分子拷贝阵列,各单分子拷贝阵列在进行高通量基因测序时处于不同的位 置,使得测序引物与单分子拷贝阵列之间的杂交,以及在酶作用下的延伸反 应可同时进行,相互之间互不干扰。因此,可以同时对大量的(成百万上千 万,甚至上亿、数十亿的)单分子拷贝阵列同时进行测序反应,然后通过采 集相应的信号,进而获得所需的序列信息,且测序的灵敏度较Sanger更高。

其中,步骤S1所述PAH基因特异性引物与目标区域完全互补或部分互补。

进一步的,每对针对PAH基因目标区域的引物中,至少有一条引物与目 标区域部分互补,且该引物的5’端带有第二标签序列。该第二标签序列,用于 在扩增目标区域过程中,对不同待测样品的目标区域扩增产物进行标记。

该第二标签序列,优选为带有特定序列的核酸分子,其碱基数不限。该 第二标签序列的碱基数优选为3~20,更优选为4~10。

此外,所述特异性引物还可带有其它标记物,包括但不限于:生物素标 记、多聚组氨酸标记、抗原、抗体,从而使得目标区域扩增产物的纯化极为 方便。

另外,同一待测样品的不同目标区域的扩增可同时进行或分别独立进行 或部分同时进行。在具体的实验过程中,可根据需要选用上述任一种方案进 行。

如果分别对各目标区域进行分别扩增的话,能够通过测定扩增产物的量 来确保步骤S1中用于构建目标区域测序文库的目标区域扩增产物的分子数保 持一致,不会因为扩增步骤而导致同一待测样品的不同目标区域拷贝数不同, 进而影响后续的测序反应结果。

当然,当各目标区域的大小相近,GC含量也相近的时候,通过合理的设 计引物,利用多重PCR技术,步骤S1可对多个目标区域进行同时扩增,且保 证各目标区域之间的扩增效率保持基本一致,这样就能够有效的提高实验效 率,降低反应的成本。

当待测样品有多个时,不同样品的目标区域的扩增必须分别进行。

其中,步骤S1所述目标区域包括PAH基因的外显子1、外显子2、外显子3、 外显子4、外显子5、外显子6、外显子7、外显子8、外显子9、外显子10、外 显子11、外显子12、外显子13中的至少一个。

进一步的,所述PAH基因特异性引物包括:SEQ ID NO:1和SEQ ID NO:26, 以及SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、 SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、 SEQ ID NO:22和SEQ ID NO:24中的至少一条,SEQ ID NO:3、SEQ ID NO:5、 SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、 SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23和SEQ ID NO:25 中的至少一条。

在选择上述特定序列的引物过程中,需遵循一个基本原则,即,所选用 的引物在后续的扩增过程中不会出现对PAH基因中的同一片段扩增多次的现 象。

在一个实施例中,步骤S1的具体实现过程是:

S11.利用PAH基因特异性引物,对待测样品中的多个目标区域进行扩增, 得到与所述多个目标区域对应的扩增产物;

S12.利用接头元件,与所述多个目标区域对应的扩增产物进行连接,得到 测序文库;所述接头元件采用平末端接头、突出末端接头、带茎环结构的接 头和分叉接头中的至少一种。

需要说明的是:

步骤S11中,对同一待测样品中的多个目标区域的扩增,可同时进行或分 别独立进行或部分同时进行。可根据实际情况,如:扩增特异性引物的退火 温度,扩增的目标区域的大小、GC含量,扩增的目标区域的数量等,进行相 应的调整。不同待测样品的目标区域的扩增必须分别进行。

步骤S12中,所述接头元件与扩增产物的连接方式,可以采用多种方式实 现,包括接头元件与扩增产物直接连接,或对扩增产物进行处理之后再进行 连接。

步骤S12中的接头元件,用于构建测序文库,可包括一种或多种接头。

其中,步骤S12所述接头元件中的至少一个接头包含有第一标签序列,该 第一标签序列,用于在文库构建过程中,对不同待测样品的测序文库进行标 记。这样,在分别获得目标区域测序文库后,不同的待测样品的目标区域测 序文库可以混合在同一个反应体系中,进行单分子扩增反应,进而同时进行 高通量测序。提高测序反应的效率,降低了样品检测的成本。

该第一标签序列优选为带有特定碱基序列的核酸分子,其碱基数不限。 进一步的,该第一标签序列的碱基数为3~20,这样,每次至少能够对43个样品 进行同时检测。在综合考虑各种情况后,如:标签的特异性、接头的成本、 接头的长度等,第一标签序列的碱基数优选为4~10。通过第二标签和第一标 签的结合,本发明的发明每次能够检测至少43×43个样品,即4096个样品。

接头的修饰方式有多种,包括但不限于:被生物素化或甲基化,或同时 被生物素化和甲基化。在一个实施例中,该接头被生物素化,并与未生物素 化的片段化产物连接,生物素的存在有利于构建的测序文库的分离纯化。在 另一个实施例中,该接头被甲基化,并与未甲基化的片段化产物连接,然后 用仅切割甲基化DNA的限制性内切酶消化连接产物,因为只有成功连接的连 接产物才能被切割,所以只有成功连接的连接物被切割,从而确保酶切产物 的单一性。

接头的结构形式也有多种,包括但不限于:平末端接头、突出末端接头、 带茎环结构的接头和分叉接头。构建测序文库过程中可以使用一种或多种接 头。其中,突出末端接头、带茎环结构的接头和分叉接头均能够有效防止在 连接过程中多个接头自连现象的发生。针对接头的上述接头形式,以下将提 供多个实施例。

在第一实施例中,接头元件采用平末端接头,该接头是双链完全互补的 核酸分子。

在第二实施例中,接头元件采用突出末端接头,该接头是双链核酸分子, 该双链核酸分子至少包括一突出末端。该突出末端的碱基数无具体限制,优 选为1~10个碱基。根据该双链核酸分子的结构,突出末端接头可分成两类, 分别是单突出末端接头、双突出末端接头。

如图2所示的单突出末端接头,其一端为平末端,另一端为突出末端。其 中带有分叉接头的单突出末端接头能够防止接头自连。为了防止一端为平末 端的单突出末端接头自连,可对平末端上的3’OH进行修饰(包括但不限于用 氨基封闭羟基),或将平末端上的5’磷酸基团去除。

如图3所示的双突出末端接头,其含有两个突出末端,这两个突出末端可 在一条核苷酸链上(图3a)或在不同的核苷酸链上(图3b)。当这两个突出 末端在不同的核酸链上时,他们相互之间不互补,以防在连接时出现接头自 连。

在第三实施例中,接头元件采用带茎环结构的接头,如图4所示。该接头 为单链核酸分子,该单链核酸分子包括第一互补配对区1、茎环区2和第二互 补配对区3(图4a),第一互补配对区1能够与第二互补配对区3互补配对,且 它们形成的互补配对区包括至少一个限制性内切酶识别位点,而通过该酶切 识别位点,特定的酶能够将茎环区切开或切除,从而将单链核酸分子变成双 链核酸分子,以便于后续的操作。优选的,如图4b所示,带茎环结构的接头 还可带有突出末端4,该突出末端可位于单链核酸分子的5’端或3’端。突出末 端4的存在能够进一步的防止接头自连现象的发生。该突出末端优选为T。

在第四实施例中,接头元件采用分叉接头,如图5所示,该接头是双链核 酸分子,包括互补区和分叉区,所述分叉区的两条单链各包含至少一个扩增 引物结合位点。优选的,所述分叉接头的互补区包括至少一个限制性内切酶 识别位点,该酶切识别位点可以在建库过程中酶切形成末端,以便于进行后 续的操作。

该分叉接头的分叉设计能够在建库过程避免多个接头自连现象的出现; 所述分叉区上包含的扩增引物结合位点,可以直接用于结合扩增引物,进行 扩增反应

其中,所述分叉接头的分叉区的每条链各含有N个核苷酸;优选的,9≤ N≤30。其中,所述分叉接头的配对区互补配对的核苷酸对数不限;优选的, 互补配对的核苷酸对数为7~15,更优选的,互补配对的核苷酸对数为9~13。

其中,所述分叉接头的配对区的3’末端为突出末端或平末端。优选的,所 述分叉接头的配对区的3’末端为突出末端,该突出末端可与所述片段化产物的 粘性末端互补配对,提高了连接效率,以利于构建测序文库反应的顺利进行。

优选的,所述分叉接头为T末端分叉接头,该接头的配对区的3’末端为突 出末端,且突出末端最后一个碱基为T;例如图6所示的T末端分叉接头,图中 N为A、T、C、G碱基中的任一种。

优选的,所述分叉接头的配对区的3’末端为突出末端,且突出末端的核苷 酸包括通用碱基。其中,突出末端的碱基数无特殊限制,优选为1~4。例如图 7所示的分叉接头,图中N为A、T、C、G碱基中的任一种,X为通用碱基。

优选的,所述分叉接头为双脱氧接头,该接头的配对区的3’末端为平末端, 且3’末端最后一个核苷酸为带有双脱氧碱基的核苷酸;例如图8所示的双脱氧 分叉接头,图中N为A、T、C、G碱基中的任一种,dd表示该3’末端最后一个 核苷酸为带有双脱氧碱基的胞嘧啶核苷酸。

应当说明的是,上述接头元件只是部分实施例,并不用以限制本发明的 保护范围。

关于步骤S12的实现方式:

在一个实施例中,步骤S12采用接头元件与扩增产物直接连接的方式,构 建出测序文库。

在另一个实施例中,当目标区域扩增产物较大时或者需要构建的目标区 域测序文库较小时,则对扩增产物进行片段化处理之后,片段化产物再与接 头元件进行连接,构建测序文库,如图9所示,步骤S12包括以下步骤:

S121.对与所述多个目标区域对应的扩增产物进行片段化,得到片段化产 物;

S122.利用接头元件,与片段化产物进行连接,构建测序文库。

通过片段化步骤S121将目标区域扩增产物变成较小的片段化产物,从而 有助于对目标区域的进一步深度测序。此外,还可以通过片段化处理,将不 同的扩增产物变成长短相似的片段化产物,能够有助于后续的统一测序。

需要说明的是:

步骤S121中,所述片段化目标区域扩增产物的方法有多种,包括但不限 于:超声法、喷雾法、化学剪切法和酶切法。可根据实际情况,采用相适应 的方法进行实验。

所述片段化处理之后还可包括片段化产物的分离纯化以及末端修饰的步 骤。根据测序的片段长度需要,对于片段化得到的核酸片段,进行目的核酸 片段的分离纯化,分离方法可以采用常用方法,如凝胶电泳、蔗糖梯度或氯 化铯梯度沉降、柱层析分离等。根据所使用的片段化方法,对所得的目的核 酸片段进一步的末端修饰,包括但不限于:磷酸化或去磷酸化、末端补平和 末端加A,以便于后续的接头元件连接。上述目的核酸片段长短不限,优选为 25bp~500bp,更优选为30bp~200bp,更优选为40bp~100bp。

步骤S121所述片段化产物的长度不限,优选为25bp~500bp,更优选为 30bp~200bp,更优选为40bp~100bp间。在实现对目标区域的测序的前提下, 随着目标区域测序文库分子中含有的目标区域片段长度的减短,高通量测序 技术的对目标区域的测序深度加深;而测序深度越深,即对目标区域的每一 个碱基位置的测序次数越多,测序结果越准确,对样品中的少量突变的检测 就越灵敏;这样就能够有效防止因为样品中带有突变的目标区域的比例偏低, 而导致该突变的测序信号的绝对值偏低,发生测序结果不准确的现象。

为了实现对目标区域测序文库大小的限制,可在步骤S121或S122之后, 对片段化产物或目标区域测序文库进行分离纯化。分离纯化的方法有多种, 包括但不限于:凝胶方法、蔗糖梯度或氯化铯梯度沉降和柱层析分离。可根 据实际情况,采用相适应的方法进行实验。

根据上述接头元件,针对步骤S122,下面将通过多个实施例和附图对本 步骤进行进一步的说明。

在本发明的一个实施例中,直接在片段化产物的两端接上接头形成测序 文库。

所述接头可采用上述的平末端接头、突出末端接头、带茎环结构的接头 和分叉接头中的至少一种。

在本发明的另一个实施例中,如图10所示,步骤S122具体可由以下步骤 实现:

S1221.利用第一接头与片段化产物的两端连接,得第一连接产物;

S1222.环化第一连接产物,得环化产物;

S1223.II s型限制性内切酶酶切环化产物,得酶切产物;

S1224.在酶切产物两端接上第二接头和第三接头,得测序文库。

在步骤S1221中,所述第一接头可采用平末端接头、突出末端接头、带茎 环结构的接头和分叉接头中的一种,所述第一接头包含有II s型限制性内切酶 酶切识别位点;所述的II s型限制性内切酶为切割位点在识别序列之外的限制 性内切酶,包括但不限于:Acu I、Alw I、Bbs I、BbV I、Bcc I、BceA I、 BciV I、BfuA I、Bmr I、Bpm I、BpuE I、Bsa I、BseM II、BseR I、Bsg I、 BsmA I、BsmB I、BsmF I、BspCN I、BspM I、BspQ I、BtgZ I、Ear I、 Eci I、EcoP15 I、Fau I、Fok I、Hga I、Hph I、HpyAV、Mbo II、Mly I、 Mme I、Mnl I、NmeAIII、Ple I、Sap I、SfaN I和TspDT I,优选为Acu I、 Bsg I、EcoP15 I或Mme I。

当所述第一接头为分叉接头时,该II s型限制性内切酶酶切识别位点位于 互补区;当所述第一接头为带茎环结构的接头时,限制性内切酶识别位点与 茎环结构之间的距离,较II s型限制性内切酶酶切识别位点与茎环结构之间的 距离近。

若片段化产物经过末端修复酶修复,以及末端加A反应,所述第一接头优 选为带T末端的分叉接头。若片段化产物只是经过末端修复酶修复,将片段化 产物的末端补平,则所述第一接头优选双脱氧接头。

在步骤S1222中,环化第一连接产物有多种实现方式。

在本发明的一实施例中,步骤S1222包括以下步骤:

S12221.利用酶切引物对第一连接产物进行扩增,得扩增产物;

S12222.对扩增产物进行酶切,使得扩增产物形成粘性末端,并自身环化 成环化产物。

所述酶切引物的3’端分别与第一连接产物的两个末端部分互补,5’端均含 有限制性内切酶识别位点。经过步骤S12221的扩增形成的扩增产物,其两个 末端均含有限制性内切酶识别位点,然后在相应的酶的作用下,使扩增产物 的两端形成粘性末端,且这两个粘性末端互补,能够进行自身环化。

在本发明的另一个实施例中,所述第一接头包含有2个酶切识别位点,其 中一个为限制性内切酶识别位点,用于使步骤S1222形成的第一连接产物的两 端在相应的酶的作用下,形成粘性末端,且它们之间互补,能够进行自身环 化。另一个为II s型限制性内切酶酶切识别位点,用于在步骤S1223中,利用 识别该酶切位点的酶识别环化产物,进行酶切,进而得到酶切产物。

应当说明,以上两个实施例仅为本发明中的两种实现环化第一连接产物 的实施方案,对于本发明的保护范围不做任何具体的限制。

在步骤S1223中,利用能够识别第一接头上的酶切识别位点,并切割环化 产物(DNA)但不切割第一接头的酶进行酶切。所述第一接头上的酶切识别 位点包括但不限于:Mme I酶切识别位点、Acu I酶切识别位点、Bsg I酶切 识别位点。

步骤S1224中,所述第二接头可为平末端接头、突出末端接头、带茎环结 构的接头和分叉接头中的一种,可带有生物素标记。所述第三接头可为平末 端接头、突出末端接头、带茎环结构的接头和分叉接头中的一种。第二接头 与第三接头可相同或不同。优选的,所述第二接头和第三接头相同,均为分 叉接头。更优选的,所述分叉接头为T末端分叉接头或双脱氧分叉接头。

需要特别说明的是,步骤S1222与S1223之间还可包括步骤S1222A:滚环 扩增环化产物,得滚环扩增产物。通过步骤S1222A,能够保证后续的酶切步 骤S1223有足够的原材料。

又或者,在步骤S1221与S1222之间还可包括步骤S1221A:利用扩增引物 对第一连接产物进行扩增,得扩增产物。所述扩增引物分别与第一连接产物 两端的接头序列互补。通过步骤S1221A,能够保证后续的环化步骤有足够的 原材料。

本方案可避免在步骤S1222之后进行滚环扩增,而用步骤S1222之前的步 骤S1221A进行普通的PCR扩增代替,可有效减少后续酶切步骤中,II s型限制 性内切酶的用量。

其中,所述第一接头优选为分叉接头。

其中,所述分叉接头的互补区可包含至少一个酶切识别位点。所述酶切 识别位点可为普通的限制性内切酶识别位点,也可为II s型限制性内切酶酶切 识别位点。

其中,步骤S1221A所述扩增引物优选为生物素化引物,有利于扩增产物 的回收纯化。

其中,步骤S1221A所述扩增引物带有至少一个特异性酶切识别位点。

若扩增引物上所带的特异性酶切识别位点是尿嘧啶碱基,则步骤S1222中 利用尿嘧啶特异性切除试剂进行酶切,然后再进行连接环化。

若扩增引物所带特异性酶切识别位点为限制性内切酶识别位点,则步骤 S1222中利用相应的限制性内切酶进行酶切,然后再进行连接环化。

在本发明的另一个实施例中,如图11所示,步骤S122具体可由以下步骤 实现:

S1221’.利用第四接头与片段化产物连接,得第二连接产物;

S1222’.II s型限制性内切酶酶切第二连接产物,得带有第四接头的酶切片 段;

S1223’.带有第四接头的酶切片段与第五接头连接,形成测序文库。

需要说明的是:

在步骤S1221’中,所述第四接头可采用平末端接头、突出末端接头、带茎 环结构的接头和分叉接头中的一种,所述第四接头包含有II s型限制性内切酶 酶切识别位点;当所述第四接头为分叉接头时,该II s型限制性内切酶酶切识 别位点位于互补区;当所述第四接头为带茎环结构的接头时,限制性内切酶 识别位点与茎环结构之间的距离,较II s型限制性内切酶酶切识别位点与茎环 结构之间的距离近。

在步骤S1222’中,利用能够识别第四接头上的酶切识别位点,并切割环化 产物(DNA)但不切割第四接头的酶进行酶切。所述第四接头上的酶切识别 位点包括但不限于:Mme I酶切识别位点、Acu I酶切识别位点、Bsg I酶切 识别位点。若片段化产物经过末端修复酶修复,以及末端加A反应,所述第四 接头优选为带T末端的分叉接头。若片段化产物只是经过末端修复酶修复,则 所述第四接头优选双脱氧接头。

在步骤S1223’中,所述第五接头可为平末端接头、突出末端接头、带茎环 结构的接头和分叉接头中的一种,可带有生物素标记。

在本发明的另一个实施例中,步骤S122具体包括以下步骤:

S1221”.直接在片段化产物的两端接上带茎环结构的接头,形成带茎环结 构的片段化产物;

S1222”.利用限制性内切酶,将带茎环结构的片段化产物的茎环区切开或 切除,从而形成测序文库。

本技术方案利用带茎环结构的接头,防止了多个接头自连现象的发生。

当通过上述几个方案形成的测序文库的数量过少,不利于后续的单分子 扩增步骤时,还可以进行以下步骤:

利用与目标区域测序文库两端的接头部分互补的引物,以所得的测序文 库为模板进行扩增,得扩增后的测序文库。该步骤可满足后续实验对目标测 序文库的量的要求。

其中,步骤S2所述的单分子扩增是指对目标区域测序文库中的分子,以 极微量(甚至单分子)的形式在空间上隔离(但这些文库分子整体上还是属 于同一个反应体系),并且在各自的空间内实现扩增,以提升各种分子在后 续测序反应中的信号。所述单分子扩增的方法包括但不限于:乳液PCR (Emulsion PCR,EPCR)、桥式PCR。

所述EPCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA 扩增。基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高 速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些 小水滴就构成了独立的PCR反应空间。理想状态下,每个小水滴只含一个DNA 模板(目标区域测序文库分子)和一个磁珠,磁珠上含有与目标区域测序文 库分子的共有序列(由接头元件引入)互补的引物,在PCR反应后,磁珠表面 就固定有拷贝数目巨大的同来源的DNA模板扩增产物。EPCR的具体步骤可参 考PCR amplification from single DNA molecules on magnetic beads in emulsion: application for high-throughput screening of transcription factor targets,Takaaki  Kojima,Yoshiaki Takei,Miharu Ohtsuka et al,Nucleic Acids Research,2005,Vol. 33,No.17;Dual primer emulsion PCR for nextgeneration DNA sequencing,Ming  Yan Xu,Anthony D.Aragon,Monica R.Mascarenas et al,BioTechniques  48:409-412(May 2010);BEAMing:single-molecule PCR on microparticles in  water-in-oil emulsions,Frank Diehl,Meng Li,Yiping He,nature methods,Vol.3, No.7,July 2006等。

所述桥式PCR的基本原理是,桥式PCR的引物被固定在固相载体上,PCR 过程中PCR扩增产物会被固定在固相载体上,且PCR扩增产物能够与固相载体 上的引物互补配对,成桥状,然后互补配对的引物以与其成桥的扩增产物为 模板进行扩增。通过控制初始模板加入的量,桥式PCR反应完成后,扩增产物 在固相载体上以一簇簇的形式存在,且每一簇的扩增产物为同来源的DNA模 板扩增产物。其具体的原理和实施方案可参考以下文献:CN20061009879.X、 US6227604。

如前所述,现有技术中,Sanger测序技术由于自身的技术限制,每次只能 对一个样品的某一段区域进行测序。为了一次性实现对样品中多个区域的同 时检测,本发明在测序方法上采取高通量基因测序方法。高通量基因测序相 对Sanger测序法检测序列信息更为方便灵敏,测序文库中的各个分子经过单分 子扩增后,每个测序文库分子均形成单分子拷贝阵列,各单分子拷贝阵列在 进行高通量基因测序时处于不同的位置,使得测序引物与单分子拷贝阵列之 间的杂交,以及在酶作用下的延伸反应可同时进行,相互之间互不干扰。因 此,可以同时对大量的(成百万上千万,甚至数亿、数十亿的)单分子拷贝 阵列同时进行测序反应,然后通过采集相应的信号,进而准确的获得所需的 序列信息,且测序的灵敏度较Sanger更高。尤其是对多个目标区域的扩增产物 进行了片段化处理,相当于对相同序列的目标区域分子的每个碱基的测序次 数增加了,能够进一步提高测序的灵敏度。

其中,步骤S3所述的高通量测序技术包括但不限于:基于聚合酶的合成 测序法、基于连接酶的连接测序法。

基于聚合酶的合成测序法是基于带可去除标记的核苷酸进行的。在每次 合成反应中,每个模板链至多只能延伸一次,基于聚合酶的合成测序法的大 致流程如下:

a.测序引物通过互补配对结合在单分子扩增产物共有的已知序列上(该单 分子扩增产物固定在引物-固相载体复合物上),在DNA聚合酶的作用下,以 带可去除标记的核苷酸进行单碱基延伸合成反应,收集该次加入核苷酸的标 记信号,即可得到与测序引物3’最末端碱基互补的单分子扩增产物(固定在引 物-固相载体复合物上)的下一位的碱基序列信息。

b.切除可去除标记,然后在DNA聚合酶的作用下,以带可去除标记的核 苷酸继续进行单碱基延伸合成反应,收集加入核苷酸的标记信号,即可得到 与测序引物3’末端碱基互补的单分子扩增产物的下两位的碱基序列信息。

重复b步骤,直至不能继续进行合成反应为止,从而获得单分子扩增产物 的全部序列信息。

基于连接酶的连接测序法是均是基于带荧光标记的寡核苷酸探针进行 的。其中一种连接酶的连接测序法是基于在特定位置带有荧光标记的寡核苷 酸探针进行的,该寡核苷酸探针带有n个碱基,从其5’端数起的第a位带有荧光 标记,其中不同的碱基对应特定的荧光标记,因为该寡核苷酸探针的3’端或5’ 端进行了特定的修饰,寡核苷酸探针之间不能直接相互连接,每次连接反应, 每个单分子扩增产物只能连接一个寡核苷酸探针。该连接测序法的大致流程 如下:

A.测序引物通过互补配对结合在单分子扩增产物共有的已知序列上(该 单分子扩增产物固定在引物-固相载体复合物上)上,利用上述的寡核苷酸探 针,在连接酶的作用下,将核酸探针与上述寡核苷酸链连接,然后采集荧光 信号,即可得与单分子扩增产物共有的已知序列的3’末端后或5’末端前第a位 碱基序列信息。

B.切除寡核苷酸上的荧光标记,在连接酶的作用下,以上述的寡核苷酸 探针为原料,继续进行连接反应,然后采集荧光信号,从而得单分子扩增产 物共有的已知序列的3’末端后或5’末端前第2a位的碱基序列信息。

重复B步骤,直至不能继续进行连接反应为止,从而获得单分子扩增产物 共有的已知序列的3’末端后或5’末端前第a、2a、3a、4a......位的碱基序列信 息。

然后将测序引物及其所连接的寡核苷酸探针从单分子扩增产物上变性洗 脱下来,换用与之前的测序引物相比3’末端或5’末端少一个碱基的引物重复上 述反应,从而获得单分子扩增产物共有的已知序列的3’末端后或5’末端前第 a-1、2a-1、3a-1、4a-1......位的碱基序列信息。重复此步骤,最后获得单分子 扩增产物共有的已知序列的3’末端后或5’末端前第a-(a-1)、2a-(a-1)、3a-(a-1)、 4a-(a-1)......位的碱基序列信息,从而获得单链扩增产物的全部序列信息。

另一种连接酶的连接测序法同样也是基于带有荧光标记的寡核苷酸探针 进行的,该寡核苷酸探针带有n个碱基,分为h(h≤n)组,同一组寡核苷酸 探针的不同荧光标记对应同一特定位置的不同碱基序列,不同组之间的区别 在于:不同荧光标记对应的特定位置不同,因为该寡核苷酸探针的3’端或5’ 端进行了特定的修饰,寡核苷酸探针之间不能直接相互连接,每次连接反应, 每个单分子扩增产物只能连接一个寡核苷酸探针。该连接测序法的大致流程 如下:

a.测序引物通过互补配对结合在单分子扩增产物共有的已知序列上(该单 分子扩增产物固定在引物-固相载体复合物上)上,利用上述寡核苷酸探针中 的一组(荧光标记对应的碱基位置为x,x≤h),在连接酶的作用下,将核酸 探针与上述寡核苷酸链连接,然后采集荧光信号,即可得与单链扩增产物共 有的已知序列的3’末端后或5’末端前第x位碱基序列信息,将测序引物及其所 连接的寡核苷酸探针从单分子扩增产物上变性洗脱下来。

b.然后重新将测序引物结合在单分子扩增产物上,换用与a步骤不同的寡 核苷酸探针组(荧光标记对应的碱基位置为y,y≤h),在连接酶的作用下, 将核酸探针与上述寡核苷酸链连接,然后采集荧光信号,即可得与单链扩增 产物共有的已知序列的3’末端后或5’末端前第y位碱基序列信息,将测序引物 及其所连接的寡核苷酸探针从单分子扩增产物上变性洗脱下来。

c.重复步骤b,直至h组寡核苷酸探针均分别进行过一次连接反应,从而获 得单分子扩增产物共有的已知序列的3’末端后或5’末端前第1、2......、h位的 碱基序列信息。

换用与之前的测序引物相比3’末端或5’末端多一个或多个通用碱基的引 物按上述原理进行反应,能够延长获得的单分子扩增产物共有的已知序列的3’ 末端后或5’末端前的碱基序列的读长。

这种基于连接酶的连接测序法的原理和具体实施方案可参考 CN200710170507.1。

基于聚合酶的合成测序法与焦磷酸测序法有一定的相似之处,因此,理 论上来说,焦磷酸测序法同样能够适用于本发明的检测方法。但是现有的焦 磷酸测序法在测序过程中采用的是天然dNTP,使得其在测序过程中,对待测 序文库上可能存在的连续单碱基重复序列的测定存在困难;而基于聚合酶的 合成测序法中的核苷酸带有的可去除标记,能够保证每次只延伸一个碱基; 基于连接酶的连接测序发中的带荧光标记的探针的3’端或5’端进行了修饰,保 证每个单分子扩增产物的片段上只连接一个荧光探针;因此本发明的基于聚 合酶的合成测序法和基于连接酶的连接测序法的准确性较焦磷酸测序高。

此外,因为现有的焦磷酸测序仪器中的蚀刻光纤玻片(PTP板)上的小孔 较大(55μm×44μm),用于容纳测序之前的乳液PCR所得的扩增产物(乳液 PCR的扩增产物被固定在10μm的珠上),这大大限制了焦磷酸测序法的测序通 量,使得其测序反应的试剂成本较高。此外,焦磷酸测序法在测序过程中还 需往蚀刻光纤玻片(PTP板)的小孔内加入含有多种蛋白的复合物以保证测序 反应的顺利进行,而这将大大提高测序反应的试剂成本。

相对的,基于聚合酶的合成测序法和基于连接酶的连接测序法可通过1μm 的磁珠或者玻片来固定单分子扩增的产物,使得其通量更高,且除了需要带 有可去除标记的核苷酸或在3’端或5’端进行了修饰的荧光标记的探针外,所需 的其他试剂无特殊要求,这就大大降低了测序反应的试剂成本。在获得相同 数据量的情况下,基于聚合酶的合成测序法和基于连接酶的连接测序法的测 序成本为焦磷酸测序法的二千分之一或更少。因此本发明方案中采用的是基 于聚合酶的合成测序法或基于连接酶的连接测序法对单分子扩增产物进行测 序。

在本发明的一具体实施例中,同时检测PAH基因的1至13外显子。设计分 别用于扩增这些外显子的特异性引物:E1F(SEQ ID NO:1)和E1R(SEQ ID  NO:2)、E2F(SEQ ID NO:3)和E2R(SEQ ID NO:4)、E3F(SEQ ID NO:5) 和E3R(SEQ ID NO:6)、E4F(SEQ ID NO:7)和E4R(SEQ ID NO:8)、E5F (SEQ ID NO:9)和E5R(SEQ ID NO:10)、E6F(SEQ ID NO:11)和E6R(SEQ  ID NO:12)、E7F(SEQ ID NO:13)和E7R(SEQ ID NO:14)、E8F(SEQ ID  NO:15)和E8R(SEQ ID NO:16)、E9F(SEQ ID NO:17)和E9R(SEQ ID NO:18)、 E10F(SEQ ID NO:19)和E10R(SEQ ID NO:20)、E11F(SEQ ID NO:21) 和E11R(SEQ ID NO:22)、E12F(SEQ ID NO:23)和E12R(SEQ ID NO:24)、 E13F(SEQ ID NO:25)和E13R(SEQ ID NO:26)。

一、待测样品DNA的提取

利用市场上常见的核酸提取试剂盒分别提取全血样品(1至10)、石蜡组 织样品(11至20)的DNA,并分别做上相应的标记;以突变型质粒1(含有突 变型序列SEQ ID NO:27)、野生型质粒1(含有野生型序列SEQ ID NO:28)、突 变型质粒2(含有突变型序列SEQ ID NO:29)、野生型质粒2(含有野生型序列 SEQ ID NO:30)为对照,对应的编号分别为21、22、23、24。

二、PAH基因目标区域的扩增

利用上述的PAH基因特异性引物,对PAH基因的目标区域进行扩增,得扩 增产物。各PAH基因的目标区域的扩增是分别进行的。反应体系如下:

上游引物(10μM)            2μL;

下游引物(10μM)            2μL;

dNTP(各2.5mM)              4μL;

待测样品DNA                20ng;

Ex Taq(5U/μL)             0.25μL;

10×Ex Taq Buffer          5μL;

ddH2O加至50μL。

PCR反应条件如下:

95℃ 3min;

94℃ 30s,58℃ 30s,72℃ 30s;重复25个循环;

72℃ 7min。

利用PCR清洁试剂盒,分别对各样品的扩增产物进行清洁,除去未扩增的 引物和dNTP,回收扩增产物。

三、构建测序文库

此步骤可有多种实施方案,本发明的一个实施例中,包括以下两个步骤:

1.扩增产物的片段化

利用超声法进行片段化处理。具体操作为:

测定回收后的扩增产物浓度,并按等摩尔数将同一样品的PAH基因的不 同目标区域的回收后的扩增产物进行混合,得混合液,并做上相应的标记。

将每个样品的混合液(约50μL)加入至400μL的TE buffer中,在430W功 率条件下超声4s,间隔20s,反复5次,得片段化产物。利用1%琼脂糖凝胶对 各样品的片段化产物进行分离纯化,切胶回收大小在40bp至100bp之间的片段 化产物。

2.构建测序文库

在构建目标区域测序文库之前,需对切胶回收的片段化产物分别进行末 端修饰,以便于接头元件的连接。在本实施例中,对切胶回收的片段化产物 的末端修饰包括磷酸化、末端补平和末端加A反应。

具体实现如下:

1)磷酸化以及末端补平反应

体系为:

切胶回收的片段化产物            20μL(约2000ng);

10mM dNTP                       1.5μL;

T4DNA聚合酶(5U/μL)             1μL;

Klenow DNA聚合酶                0.1μL;

T4多核苷酸激酶(10U/μL)         0.5μL;

10m MATP                        1.5μL;

10×T4连接酶缓冲液              10μL;

加ddH2O至100μL。

反应条件为:20℃孵育20min。反应结束后利用回收试剂盒进行纯化回收。

2)末端加A尾

反应体系为:

磷酸化以及末端补平后的回收产物           60μL(约1000ng);

Klenow缓冲液(NEB Buffer2)                10μL;

10mM dATP                                2μL;

Klenow酶(3’to 5’exo minus,10U/μL)    1μL;

加ddH2O至100μL。

反应条件为:37℃孵育30min。反应结束后利用纯化试剂盒纯化回收。

3)连接接头1

本实施例中,采用如图6所示的T末端分叉接头作为接头1,同一样品的所 使用的T末端分叉接头相同,不同样品的T末端分叉接头不同,区别在于标签 序列不同,不同样品对应的标签序列如下表1所示。

表1各样品建库过程中的第一接头上的标签序列

在T4连接酶的作用下,上述T末端分叉接头分别与加A尾后纯化回收的产 物进行连接,形成带接头1的片段。连接体系为:

加A尾后纯化回收的产物        50μL(约500ng);

接头1                        2μL(约3000ng);

10mM ATP                     5μL;

T4DNA连接酶(10U/μL)         1μL;

10×T4连接酶缓冲液           10μL;

加ddH2O至100μL。

反应条件为:16℃孵育4h以上。反应结束后利用纯化试剂盒纯化回收。

4)PCR扩增带接头1的片段

扩增体系为:

带接头1的片段                        约300ng;

10×Ex Taq Buffer                    100μL;

Primer F(100μM,SEQ ID NO:33)      10μL;

Primer R(100μM,SEQ ID NO:34)      10μL;

Ex Taq(5U/μL)                       7.5μL;

dNTP(各2.5mM)                        80μL;

ddH2O up to 1000μL。

PCR反应条件如下:

95℃ 3min;

94℃ 30s,58℃ 30s,72℃ 30s;重复25个循环;

72℃ 7min。

利用PCR清洁试剂盒,分别对各样品的扩增产物进行清洁,除去未扩增 的引物和dNTP,回收带接头1的片段的扩增产物。

5)II s型限制性内切酶酶切

利用Acu I酶切回收后的带接头1的片段的扩增产物,反应体系如下:

回收后的带接头1的片段的扩增产物    60μL(3-5μg);

10×NEB Buffer 4                   8μL;

Acu I(NEB)                         2μL(10U);

SAM(3.2mM)                         1μL(终浓度50μM);

ddH2O up to 80μL。

反应条件:37℃孵育1h。反应结束后利用纯化试剂盒纯化回收酶切产物。

6)连接接头2

利用如图7所示的突出末端分叉接头作为接头2,与回收的酶切产物进行 连接,得测序文库,连接体系如下:

回收的酶切产物            2μg;

接头2                     1μL(10pM);

10T4DNA连接酶(3U/μL)     1μL;

10×T4连接酶缓冲液        2μL;

加ddH2O至100μL。

连接条件,14℃孵育2h。反应结束后利用纯化试剂盒纯化回收,然后变 性形成单链,得测序文库。

四、对测序文库进行单分子扩增

测定步骤三所获得的24个测序文库各自的浓度,然后按同等浓度混合, 然后进行单分子扩增,得单分子扩增产物,所述单分子扩增的方法可采用 EPCR或桥式PCR。

优选为EPCR扩增,单分子扩增引物优选为:SEQ ID NO:25和SEQ ID  NO:26。

五、对单分子扩增产物进行高通量测序

所述测序方法可采用基于合成酶的合成测序法,也可采用基于连接酶的 连接测序法。对测序结果进行生物信息学分析,即可得到上述26个样品的PAH 基因序列信息如下:

样本2的外显子12存在G1238C(即R413P)杂合突变;样本5的外显子7存 在G728A(即R243Q)杂合突变;样本8的外显子7存在G728A(即R243Q)杂 合突变;样本9的外显子12存在G1238C(即R413P)纯合突变;样本13的外显 子12存在G1238C(即R413P)杂合突变;样本15的外显子7存在G728A(即 R243Q)杂合突变;样本18的外显子12存在G1238C(即R413P)杂合突变。 上述样本的其他序列均为野生型。其他样本均为野生型。

对照样品的检测结果均与对照样品本身含有的基因序列相符。

应当说明,本实施例只是本发明的一个具体实施例,对本发明无任何限 定作用,例如PAH基因特异性引物的具体序列以及组合均可进行相应的替换, 除此之外,本实施例中的多个步骤均可参照前述的方法进行替换,在此不再 赘述。

针对本发明的对PAH基因进行测序的方法的灵敏度,本发明采用下述实 施例进行验证。

通过常规设计,构建分别含有PAH基因外显子7野生型序列(SEQ ID  NO:28)和突变型序列(SEQ ID NO:27)的质粒,含有PAH基因外显子12野生 型序列(SEQ ID NO:30)和突变型序列(SEQ ID NO:29)的质粒。

然后配置突变率分别为20%、10%、5%、3%、1%、0%的质粒混合液。 以含有1000个拷贝质粒的上述质粒混合液为模板,然后按参照上一实施例的 方法进行检测。检测结果见表2。

表2PAH基因灵敏度实验检测结果

结果显示,本发明的对PAH基因进行测序的方法的最低检测限为3%左右, 在5%及以上的检测结果与实际情况基本一致。

一种对苯丙氨酸羟化酶基因进行测序的试剂盒,包括:

PAH基因特异性引物,用于对待测样品中的多个目标区域进行扩增;

接头元件,用于与扩增产物结合构建测序文库。

该试剂盒用于目标区域测序,能同时对样本的多个目标区域进行深度测 序,提高了检测效率,同时还能提高检测的准确性和灵敏度,准确得出这些 目标区域的序列信息,包括已知突变和位置突变的各突变位点的变异情况, 以及各突变位点发生变异的频率,检测灵敏度高,能用于目标区域的大规模 人群筛查,确定该目标区域的各种基因型的比例。

其中,所述接头元件用于构建目标区域测序文库,包括至少一种或多种 接头。

其中,所述接头元件可采用多种形式,如:平末端接头、突出末端接头、 带茎环结构的接头、分叉接头中的至少一种。

其中,所述接头可被甲基化或生物素化,或同时被生物素化和甲基化。

其中,所述接头元件中的至少一个接头包含有第一标签序列,用于在文 库构建过程中,对不同待测样品的测序文库进行标记。该第一标签序列优选 为带有特定碱基序列的核酸分子,其碱基数不限,该第一标签序列的碱基数 优选为3~20,更优选为4~20。

其中,所述的PAH基因特异性引物与目标区域互补或部分互补。

进一步的,每个目标区域对应的特异性引物中,至少一条引物与该目标 区域部分互补,该引物的5’端包含有第二标签序列,该第二标签序列,用于在 扩增目标区域过程中,对不同待测样品的目标区域扩增产物进行标记。该第 二标签序列优选为带有特定碱基序列的核酸分子,其碱基数不限。

更进一步的,该第二标签序列的碱基数为3~20,更优选为4~10。

其中,所述目标区域包括PAH基因的外显子1、外显子2、外显子3、外显 子4、外显子5、外显子6、外显子7、外显子8、外显子9、外显子10、外显子 11、外显子12、外显子13中的至少一个。

进一步的,所述PAH基因特异性引物包括:SEQ ID NO:1和SEQ ID NO:26, 以及SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、 SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、 SEQ ID NO:22和SEQ ID NO:24中的至少一条,SEQ ID NO:3、SEQ ID NO:5、 SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、 SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23和SEQ ID NO:25 中的至少一条。

其中,所述试剂盒还可以包括PCR扩增试剂,所述PCR扩增试剂包括PCR 酶、dNTP、PCR缓冲液、Mg2+溶液。

其中,所述试剂盒还可包括用于识别接头元件上的酶切识别位点的酶。

应当说明的是,通过本发明的方法或试剂盒检测得到的基因序列信息, 可用于各种科学研究,包括但不限于人群序列分析、基因功能研究、蛋白功 能研究。例如,结合后续进一步的分子生物学试验、临床试验、临床观察及 综合数据的统计分析等,从而实现多种科研目的,包括但不限于:某特定人 群的某些特定基因的基因型分布、各基因的突变类型与相关生理活动的关系 等。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本 发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本 发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号