首页> 中国专利> 一种测定待检测样本中疾病相关核酸分子的核苷酸序列的方法

一种测定待检测样本中疾病相关核酸分子的核苷酸序列的方法

摘要

本发明涉及一种测定待检测样本中疾病相关核酸分子的核苷酸序列的方法。所述方法包括:对待测样本中片段化的、源自基因组DNA的双链核酸分子末端加入接头,并进行富集;用核酸芯片对含接头的DNA片段进行捕获,将捕获的片段在高通量测序平台进行测序。基于已知的基因位点信息,对测序结果进行分析,可快速、高通量地得到样本中疾病相关核酸分子的核苷酸序列,从而用于例如单基因病的检测。本发明还提供了可用于所述方法的、固定有数种至数万种疾病特异性探针的核酸芯片,以及包含所述芯片的试剂盒。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-10-28

    专利权的转移 IPC(主分类):C12Q1/68 登记生效日:20150924 变更前: 变更后: 申请日:20111014

    专利申请权、专利权的转移

  • 2014-04-02

    授权

    授权

  • 2012-03-14

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20111014

    实质审查的生效

  • 2012-01-25

    公开

    公开

说明书

技术领域

本发明涉及生物技术领域,具体地,涉及一种测定待检测样本中疾病相关核 酸分子的核苷酸序列的方法。所述方法包括:设计具有多种疾病特异性探针芯片、 对带有接头的特异性目的DNA片段进行捕获和富集、高通量测序、分析基因突 变位信息等步骤。

背景技术

各种模式生物基因组测序工作的完成,极大地提高了人们在基因水平对疾 病致病机理和机体生理状态的认识,也极大地促进了第二代高通量测序技术的 发展。目前完成基因组组测序的生物有:人、小鼠、大鼠、果蝇、水稻、大豆、 拟南芥等。然后由于受到测序成本的限制,对个体进行基因组测序和疾病相关 基因的鉴定和分析远不能满足日益发展的需要。

单基因病是由一对等位基因控制的疾病或病理性状,又称孟德尔遗传病或 单基因遗传病。目前已经发现的单基因病有6000多种,其中表形已知而分子基 础未知的疾病有1700多种,而由于遗传异质性,表型和致病分子基础已知(约 2900多种)的单基因病中,还有很多的亚型未被发现。基因是位于染色体上的遗 传单位,染色体有常染色体和性染色体之分,基因也有显性基因与隐性基因之 别,因此位于不同染色体上的致病基因具有不同的遗传方式。通常,单基因病 可分为常染色体显性遗传病、常染色体隐性遗传病、x伴性显性遗传病、x伴性 隐性遗传病、Y伴性遗传病等几类。

单基因病的检测方法目前主要基于第一代测序技术,主要为以下几种:系 谱分析、染色体核型分析、酶促反应及活性测定、RALF、SSCP(单链构象多态 性)、MOLDI-TOF、FISH(荧光原位杂交)、a-CGH(a-比较基因组杂交)、qPCR、 MLPA(多重连接探针扩增)、Sanger法等。上述方法中存在诸多缺点,比如:系 谱分析、染色体核型分析、酶促反应活性测定方法和FISH法分析方法都是染色 体水平的检测,准确性较低;RALF、SSCP和MOLDI-TOF分析方法是间接检测 方法,不能直接反映位点的变化;a-CGH、qPCR、MLPA只能针对特定位点, 不能对新发现的突变位点进行解读,并且以上方法其测序通量很小,且要先经 过PCR扩增过程。因此,虽然以Sanger法为基础的第一代测序技术是目前单基 因病检测的金标准,但是由于同时测序的样本数很少,检测的单基因病种类有 限,仅限于一种或几种,测序成本高昂,不能对多种已知分子基础的单基因病 进行同时检测,大大限制了个体基因病的鉴定。

目前本领域尚缺乏有效的测定待检测样本中疾病相关核酸分子的核苷酸序 列的方法。因此迫切需要针对已知的多种疾病的基因信息,开发新的检测个体 化的样本中疾病相关核酸分子的核苷酸序列的方法。

发明内容

本发明的目的是提供一种测定待检测样本中疾病相关核酸分子的核苷酸序 列的方法及其应用。

本发明的另一目的是提供一种测定待检测样本中疾病相关核酸分子的核苷 酸序列的试剂盒。

在本发明的第一方面,提供了一种测定待检测样本中疾病相关核酸分子的核 苷酸序列的方法,包括步骤:

a.提供一待检测样本,所述样品含有经打断的、源自基因组DNA的双链核酸 片段,并且所述核酸片段具有平末端;

b.对于上一步骤的所述双链核酸片段,在末端添加接头连接序列;并且通过 所述接头连接序列,在所述双链核酸片段的两端添加接头,其中所述接头具有引物 结合区以及连接互补区,所述的连接互补区与所述的接头连接序列互补;

c.对步骤(b)获得的带有接头的DNA双链核酸片段,用第一引物和第二引物进 行PCR扩增,从而获得第一PCR扩增产物的混合物,其中所述的第一引物和第二引 物具有对应于所述接头的引物结合区的接头结合区,以及位于接头结合区外侧的测 序探针结合区;

d.对所述的第一PCR扩增产物的混合物进行单链化,并用封闭分子封闭位于 所述扩增产物两端的、对应于第一引物和第二引物的区域,从而获得两端被封闭的 单链扩增产物的混合物;

e.用核酸芯片,从所述的经封闭的单链扩增产物的混合物中,捕获疾病相关 的核酸分子;

f.对上一步骤中经捕获的核酸分子,用第三引物和第四引物进行PCR扩增, 从而获得第二PCR扩增产物的混合物,其中第三引物和第四引物分别特异性对应于 或结合于所述的第一引物和第二引物;

g.对上一步骤获得的第二PCR扩增产物的混合物进行测序,从而获得样本中 疾病相关核酸分子的核苷酸序列。

在另一优选例中,步骤(g)中将所述的第二PCR扩增产物的混合物与固相载体 上固定的测序探针进行杂交,并进行固相桥式PCR扩增,形成测序簇;然后对所述 测序簇用“边合成-边测序”法进行测序,从而得到样本中疾病相关核酸分子的核苷 酸序列。

在另一优选例中,步骤(a)的所述经打断的、源自基因组DNA的双链核酸片段 长度为:100-1000bp,平均长度为800-1000bp。

在另一优选例中,所述片段长度为150-500bp,较佳地为200-300bp。

在另一优选例中,所述核酸片段具有的平末端是通过末端修复的方法制备。

在另一优选例中,步骤(b)中的接头连接序列为poly(N)n,其中,各个N分别独 立地选自A、T、G或C,n为选自1-20的任一正整数。

在另一优选例中,步骤(b)中所述的接头连接序列为poly(A)n,其中,n为1-20 的正整数,较佳地n=1-2。

在另一优选例中,步骤(b)中所述的接头连接互补区序列为poly(N’)m,其中各 N’分别独立地选自A、T、G或C,m为1-20的正整数,并且poly(N)n和poly(N’)m为 互补序列。

在另一优选例中,m为选自1-3的任一正整数。

在另一优选例中,所述的接头连接互补区的长度与接头连接序列的长度相同, 即poly(N)n和poly(N’)m为完全互补序列。

在另一优选例中,所述的接头连接互补区为poly(T)m,其中,m为1-20的正整 数,较佳地m=1-2。

在另一优选例中,步骤(c)中所述的第一引物和第二引物为长度30-80bp的寡核 苷酸。

在另一优选例中,第一引物和第二引物长度为55-65bp。

在另一优选例中,所述的第一引物和第二引物是不同的,和/或所述的第三引 物和第四引物是不同的。

在另一优选例中,步骤(d)所述的封闭分子封闭第一PCR扩增产物中对应于第 一引物和第二引物的70%-100%区域。

在另一优选例中,步骤(d)中所述的封闭分子封闭第一PCR扩增产物中对应于 第一引物和第二引物的100%区域。

在另一优选例中,步骤(e)中所述的核酸芯片固定有5-200,000种对应于所述疾 病的特异性探针。

在另一优选例中,步骤(e)中所述芯片上特异性探针的种类为50-150,000种, 更佳地500-100,000种,最佳地5000-80,000种。

在另一优选例中,所述探针的序列对应于疾病致病基因的以下区域:外显 子和/或外显子前后两端200bp。

在另一优选例中,所述特异性探针的长度为20-120mer,较佳地,50-100mer, 更佳地,60-80mer。

在另一优选例中,所述特异性探针为全人工合成或体外克隆合成。

在另一优选例中,步骤(f)所述的第三引物和第四引物分别特异性结合于所述 的第一引物和第二引物的外侧,并且长度小于第一引物和第二引物。

在另一优选例中,所述的第三引物和第四引物长度为15-40bp,较佳地为 20-25bp。

在另一优选例中,所述样本来源于人、动物、植物,或微生物。

在另一优选例中,所述待测样本来源于人或非人哺乳动物,较佳地,来源于 人。

在另一优选例中,所述待测样本含有人基因组DNA。

在另一优选例中,所述疾病为孟德尔单基因病。

在另一优选例中,所述疾病选自下组:家族性腺瘤样息肉病、软骨发育不 良、家族性高胆固醇血症、多指畸形、马凡综合症、遗传性舞蹈病、秃发、苯 丙酮尿症、胱氨酸尿症、遗传性高度近视、抗D佝偻病、遗传性肾炎、血友病、 地中海贫血、节性脑硬化综合症、杜氏肌营养不良、进行性肌营养不良、多囊 肾综合症、性别决定基因突变所致的性反转,或其组合。

在本发明的第二方面,提供了一种可用于本发明第一方面所述方法的、用于 测定待检测样本中疾病相关核酸分子的核苷酸序列的试剂盒,所述试剂盒包括:

(1)第一容器以及位于容器内的核酸芯片;

(2)第二容器以及位于容器内的接头;

(3)第三容器以及位于容器内的选自下组的引物:(a)第一引物和/或第二引 物;或(b)第三引物和/或第四引物;

(4)第四容器以及位于容器内的封闭分子;

(5)检测说明书。

在另一优选例中,所述试剂盒还包括任选自下组的试剂:用于进行PCR扩 增所需的试剂、用于进行封闭反应所需的试剂、用于进行杂交反应所需的试剂、 或其组合。

在另一优选例中,所述疾病为孟德尔单基因病。

在另一优选例中,所述疾病选自下组:家族性腺瘤样息肉病、软骨发育不 良、家族性高胆固醇血症、多指畸形、马凡综合症、遗传性舞蹈病、秃发、苯 丙酮尿症、胱氨酸尿症、遗传性高度近视、抗D佝偻病、遗传性肾炎、血友病、 地中海贫血、节性脑硬化综合症、杜氏肌营养不良、进行性肌营养不良、多囊 肾综合症、性别决定基因突变所致的性反转,或其组合。

在另一优选例中,所述的核酸芯片表面固定有选自下组的一种或多种探 针:

探针1:序列如SEQ ID NO:7所示,捕获位置112073411,检测家族性腺瘤 样息肉;

探针2:序列如SEQ ID NO:8所示,捕获位置51479999,检测多囊肾综合 症;

探针3:序列如SEQ ID NO:9所示,捕获位置135766620,检测节性脑硬化 综合症;

探针4:序列如SEQ ID NO:10所示,捕获位置103231969,检测苯丙酮尿 症;

探针5:序列如SEQ ID NO:11所示,捕获位置48700368,检测马凡综合症;

探针6:序列如SEQ ID NO:12所示,捕获位置31137199,检测杜氏肌营养 不良。

应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例) 中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方 案。限于篇幅,在此不再一一累述。

附图说明

下列附图用于说明本发明的具体实施方案,而不用于限定由权利要求书所 界定的本发明范围。

图1显示了本发明一个实例中,可以同时检测多种单基因病的流程图。

具体实施方式

本发明人经过广泛而深入的研究,首次建立了一种测定待检测样本中疾病 相关核酸分子的核苷酸序列的方法。具体而言,本发明人根据现有疾病基因的信 息,设计了固定有多种疾病特异性探针的核酸芯片;对待测样本中片段化的、 源自基因组DNA的双链核酸分子的末端加入接头,并进行富集;用核酸芯片对含 接头的DNA片段进行捕获,将捕获的片段在高通量测序平台进行测序,基于已 知的基因位点信息,对测序结果进行分析,得到样本中疾病相关核酸分子的核苷 酸序列。

术语

本文所用,术语“含有”包括“具有(comprise)”、“基本上由...构成”和“由... 构成”。

单基因病

如本文所用,“单基因病”一词是指由一对等位基因控制的疾病或病理性状, 又称孟德尔遗传病,可以分为常染色体显性遗传病、常染色体隐性遗传病、x 伴性遗传病、Y伴性遗传病。

常染色体显性遗传病致病基因定位于常染色体上,常见的亚型:完全显性: 正常纯合子和杂和子患者在表型上无差异;不完全显性:杂和子表现介于显性 纯合子患者和正常人之间,常表现为轻病型;不规则显型:由于某种原因可使 杂合子的显性基因不表现出相应的症状;共显性:等位基因之间无显性与隐性 之分,在杂合体时都能表现两种基因作用;延迟显性:杂合子在生命早期显性 基因不表达,待一定年龄后才表达;从性显性:杂合子的表达受性别的影响, 在某一性别表达出相应的表现型,在另一性别不表达相应表现型。常染色体隐 性遗传病的常染色体上的致病基因在杂合状态时不表现相应的疾病,而只在纯 合子时才致病。定位于X染色体上的致病基因随X染色体而遗传疾病,包括X连 锁显性遗传和X连锁隐性遗传。定位于Y染色体上的致病基因随Y染色体而遗传 疾病。

适用于本发明筛查方法的单基因病包括但不限于:家族性腺瘤样息肉病、 软骨发育不良、家族性高胆固醇血症、多指畸形、马凡综合症、遗传性舞蹈病、 秃发、苯丙酮尿症、胱氨酸尿症、遗传性高度近视、抗D佝偻病、遗传性肾炎、 血友病、地中海贫血、节性脑硬化综合症、杜氏肌营养不良、进行性肌营养不 良、多囊肾综合症、性别决定基因突变所致的性反转,或其组合。

外显子

如本文所用,“外显子”一词是指在成熟mRNA中被保留下的部分,即成熟 mRNA对应于基因中的部分。内含子是在mRNA加工过程中被剪切掉的部分, 在成熟mRNA中不存在。外显子和内含子都是对于基因而言的,编码的部分为 外显子,不编码的为内含子,内含子没有遗传效应。

探针

如本文所用,“探针”一词是指能够检测互补核酸序列的简单DNA或RNA分 子。探针必须是纯净的,而且不受其他不同序列核酸的影响。典型的探针是克 隆的DNA序列或通过PCR扩增获得的DNA,人工合成的寡核苷酸或从体外转录 克隆DNA序列后获得的RNA,也可以作为探针。探针长度可以从20-120mer, 较佳地50-100mer,更佳地60-80mer。探针设计和合成方法为本领域技术人员所 熟知,根据单基因病的已知的致病基因的外显子及其前后两端序列(较佳地前后 200bp左右),设计探针。在一个优选例中,探针长度50-80mer。可以使用人工 化学合成法合成探针或使用市售探针。一种典型的探针序列见表2。

芯片

如本文所用,“芯片”一词是指可以采用微加工技术在芯片的基底材料上加 工出各种微细结构,施加必要的生物化学物质并进行表面处理,将各种探针分 子与表面固定化,制得含有大量探针的材料。

本领域技术人员可以使用通用的方法获得芯片。DNA芯片制备方法通常有 4种。第1种是光引导原位合成法,在微加工技术中用光刻工艺与光化学合成法 相结合。第2种方法是化学喷射法,将合成好的寡核苷酸探针定点喷射到芯片 上并加以固定化来制作DNA芯片。第3种方法是接触式点涂法,通过高速精密 机械手的精确移动让移液头与玻璃芯片接触而将DNA探针涂敷在芯片上。第4 种方法是使用4支分别装有A,T,G,C核苷的压电喷头在芯片上并行合成出DNA 探针。

本发明提供了一种表面固定有对应于已知基因特定序列探针的核酸芯片, 所述芯片表面的探针种类可达数万种,能一次对同一个待测样品检测多种疾 病。

DNA文库及其制备

如本文所用,“DNA文库制备”一词是指对基因组的目的片段进行打断,获 得一组具有一定大小的DNA片段混合物。

文库的制备方法为本领域技术人员所熟知,包括(但不局限于)步骤:

1.提供一个待检测样本,所述样品含有经打断的、源自基因组DNA的双链核 酸片段,并且所述核酸片段具有平末端;

2.对于上一步骤的所述双链核酸片段,在末端添加接头连接序列;并且通过 所述接头连接序列,在所述双链核酸片段的两端添加接头,其中所述接头具有引物 结合区以及连接互补区,所述的连接互补区与所述的接头连接序列互补;两侧3’ 端和5’端的接头的引物结合区序列不同。

3.对上一步骤获得的带有接头的DNA双链核酸片段,用第一引物和第二引物 进行扩增,从而获得PCR扩增产物的混合物,其中所述引物具有对应于所述接头的 引物结合区的接头结合区,并且位于接头结合区外侧的测序探针结合区。

在一个优选例中,还可以对打断产物、末端修复产物、接头产物和富集产 物进行纯化。纯化条件及参数为本领域技术人员所熟知,对反应的条件进行一 定的变化或优化也在本领域技术人员能力范围之内。

外显子捕获

如本文所用,术语“外显子捕获”,“芯片杂交”可互换使用,指的是对带有 疾病特异性探针的芯片对文库中含有目标外显子区域的DNA片段进行特异性 选择和结合的过程。

DNA分子正常情况下是双链,因此捕获之前,DNA分子必须变为单链,一 般是通过加热使其变性而达到解链目的,解链的DNA分子被迅速冷却,即保持 单链状态。文库变性后在杂交平台与芯片进行捕获杂交。含有目标外显子区域 的DNA片段与固定在芯片上的探针之间在严格的条件下进行分子杂交。较佳 地,芯片上探针分子的浓度要远远高于靶分子浓度。待杂交完毕后,通过变性 等方法收集捕获的序列并纯化,得到来自捕获后的序列混合物。

本领域技术人员可以通过通用的方法进行外显子捕获和目的片段的洗脱 和纯化,也可以应用市售(如:德国Qiagen公司的MinElute PCR Purification kit) 试剂盒进行上述过程。

在一个优选例中,对待检测的DNA文库的PCR扩增产物的混合物进行单链化, 并用封闭分子封闭所述扩增产物中对应于第一引物和第二引物的区域,从而获得两 端被封闭的单链扩增产物的混合物;用核酸芯片从所述的经封闭的单链扩增产物的 混合物中,捕获疾病相关的核酸分子;对经捕获的核酸分子,用第三引物和第四引 物进行扩增,从而获得第二PCR扩增产物的混合物,其中第三引物和第四引物分别 特异性结合于所述的第一引物和第二引物;对上一步骤获得的第二PCR扩增产物的 混合物进行测序,从而获得样本中疾病相关核酸分子的核苷酸序列。

引物

如本文所用,术语“引物”指的是能与模板互补配对,在DNA聚合酶的作 用合成与模板互补的DNA链的寡聚核苷酸的总称。引物可以是天然的RNA、 DNA,也可以是任何形式的天然核苷酸,引物甚至可以是非天然的核苷酸如 LNA或ZNA等。

引物“大致上”(或“基本上”)与模板上一条链上的一个特殊的序列互补。引 物必须与模板上的一条链充分互补才能开始延伸,但引物的序列不必与模板的 序列完全互补。比如,在一个3’端与模板互补的引物的5’端加上一段与模板不 互补的序列,这样的引物仍大致上与模板互补。只要有足够长的引物能与模板 充分的结合,非完全互补的引物也可以与模板形成引物-模板复合物,从而进行 扩增。

在本发明中,几类重要引物的序列和名称见表1。

表1

第一引物(SEQ ID NO:1)和第二引物(SEQ ID NO:2)对带有接头的DNA双 链核酸片段进行扩增,获得第一PCR扩增产物,第一引物和第二引物具有对应于所 述接头的引物结合区的接头结合区,并且位于接头结合区外侧的测序探针结合区。 封闭分子1(SEQ ID NO:3)和封闭分子2(SEQ ID NO:4)的作用是在进行序列捕 获时,与接头互补,避免捕获非特异性序列。第三引物(SEQ ID NO:5)和第四 引物(SEQ ID NO:6)的作用是大量扩增捕获的特异性DNA片段,以便进行下一 步测序。

富集度检测

本发明还提供了一种检测扩增产物富集度(Enrichment)的方法,包括: 连接介导聚合酶链式反应(Ligation-Mediated PCR,LM-PCR)和qPCR(Real-time  Quantitative PCR Detecting System)两个步骤。本领域技术人员可以通过荧光定 量核酸扩增检测系统,对富集度进行检测。qPCR是在PCR反应体系中,加入过 量荧光染料(SYBR等),荧光染料特异性地掺入DNA双链后,发射荧光信号,而 不掺入链中的SYBR染料分子不会发射任何荧光信号,在PCR指数扩增期间通过 连续监测荧光信号强弱的变化来即时测定特异性产物的量,并据此推断目的基 因的初始量。

如本文所用,LM-PCR是指连上特异性接头,专一性地扩增的DNA片段, 从而达到灵敏检测核酸片段的目的。此外,LM-PCR检测是半定量的,因此可 进行不同样品的比较。

在本发明的一个优选例中,富集度检测包括步骤:

1)将稀释好的4种NSC Assay mix取出在冰上溶解;

2)根据Nanodrop检测浓度,将Non-Captured以及Captured LM-PCR产物稀 释至1ng/μl,最后体积要求>12μl;

3)按照每个样品4种NSC Assay,每个样品包括2种DNA模版,每个样品需 要4×2=8个反应,每个平板需要1个阴性对照共4个反应;

4)在1.5ml的离心管中配制QPCR反应混合液;

5)将配置好的12μl QPCR反应混合液转移至96孔QPCR反应板中,向其中 加入3μl稀释的1ng/μl LM-PCR产物,把所有的试剂和样品加完后使用封口膜将 平板封口,4000rpm离心2min;

6)将96孔板置于QPCR仪上进行检测;

7)实验完成后分析试验结果,整理QPCR试验数据,根据公式计算富集度, 判断文库是否合格,合格后能否进行下一步试验。Average Fold Enrichment>60 时,文库合格,可以进行下一步测序。Enrichment计算格式见表2。

表2

高通量测序

基因组的“再测序”使得人类能够尽早地发现与疾病相关基因的异常变化, 有助于对个体疾病的诊断和治疗进行深入的研究。本领域技术人员通常可以采 用三种第二代测序平台进行高通量测序:454FLX(Roche公司)、Solexa Genome  Analyzer(Illumina公司)和Applied Biosystems公司的SOLID等。这些平台共同的 特点是极高的测序通量,相对于传统测序的96道毛细管测序,高通量测序一次 实验可以读取40万到400万条序列,根据平台的不同,读取长度从25bp到450bp 不等,因此不同的测序平台在一次实验中,可以读取1G到14G不等的碱基数。

其中,Solexa高通量测序包括DNA簇形成和上机测序两个步骤:PCR扩增 产物的混合物与固相载体上固定的测序探针进行杂交,并进行固相桥式PCR扩增, 形成测序簇;对所述测序簇用“边合成-边测序法”进行测序,从而得到样本中疾病 相关核酸分子的核苷酸序列。

DNA簇的形成是使用表面连有一层单链引物(primer)的测序芯片(flow cell), 单链状态的DNA片段通过接头序列与芯片表面的引物通过碱基互补配对的原 理被固定在芯片的表面,通过扩增反应,固定的单链DNA变为双链DNA,双链 再次变性成为单链,其一端锚定在测序芯片上,另一端随机和附近的另一个引 物互补从而被锚定,形成“桥”;在测序芯片上同时有上千万个DNA单分子发生 以上的反应;形成的单链桥,以周围的引物为扩增引物,在扩增芯片的表面再 次扩增,形成双链,双链经变性成单链,再次成为桥,称为下一轮扩增的模板 继续扩增;反复进行了30轮扩增后,每个单分子得到1000倍扩增,称为单克隆 的DNA簇。

DNA簇在Solexa测序仪上进行边合成边测序,测序反应中,四种碱基分别 标记不同的荧光,每个碱基末端被保护碱基封闭,单次反应只能加入一个碱基, 经过扫描,读取该次反应的颜色后,该保护集团被除去,下一个反应可以继续 进行,如此反复,即得到碱基的精确序列。在Solexa多重测序(Multiplexed  Sequencing)过程中会使用Index(标签)来区分样品,并在常规测序完成后,针对 Index部分额外进行7个循环的测序,通过Index的识别,可以在1条测序甬道中 区分12种不同的样品。

本发明提供了一种测定待检测样本中疾病相关核酸分子的核苷酸序列的方 法。参见图1,本发明的一个优选例包括(但不局限于)以下步骤:

将样本中的基因组DNA打断成为主带在200-250bp的小片段,对这些双链 DNA进行末端修复成为平末端DNA,在每一条链的3’端加入一个“A”,并与带 有一个“T”的接头相连,成为两端都带有接头的双链的DNA片段混合物;将所 述混合物与固定有疾病特异性探针的芯片进行杂交,捕获疾病特异性的DNA片 段,将捕获的DNA片段富集后进行固相桥式PCR扩增,形成测序簇;对所述测序 簇用“边合成边测序”的方法,上机测序,最后进行数据分析。

测序结果分析:

(1)将测序结果原始read质控,其中原始read质控包括的项目见表3;

表3

(2)进行短序列比对,输出,原始比对结果-SAM文件;

(3)使用samtools工具将比对结果处理,包括步骤:格式转换、压缩;比 对结果按染色体号及坐标进行排序;同一个文库的泳道结果进行合并;分别对 每一个文库去重复(duplication);将所有文库合并到一起,最后,使用soapsnp 工具进行SNP检测。

试剂盒

本发明还提供了一种用于测定待检测样本中疾病相关核酸分子的核苷酸序列 的试剂盒,所述试剂盒包括:

(1)第一容器以及位于容器内的核酸芯片;

(2)第二容器以及位于容器内的接头;

(3)第三容器以及位于容器内的选自下组的引物:(a)第一引物和/或第二引 物;或(b)第三引物和/或第四引物;

(4)第四容器以及位于容器内的封闭分子;

(5)检测说明书。

在本发明的一个优选例中,试剂盒还包括任选自下组的试剂:

用于进行PCR扩增所需的试剂、用于进行封闭反应所需的试剂、用于进行 杂交反应所需的试剂、或其组合。

本发明的主要优点包括:

1.通过固定有核酸探针的芯片对目的DNA片段捕获,覆盖全面;

2.使用1对特异性与DNA片段两端接头结合的引物对所有捕获的片段进行 扩增,获得具有同样的接头序列而中间片段不同的扩增混合物,

3.将扩增产物先合成测序簇,再进行边合成边测序,因此效率高,可以精 确读取重复序列,可以达到很高测序深度;

4.可以同时检测多个样品,且没有荧光背景的干扰;

5.试验费用低,只有传统方法的1/100;

6.不受物种的限制,人、动物、微生物、植物等都可以进行个体式检测;

7.灵敏度高、精确度高、重复性好。

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说 明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方 法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold  Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的 条件。

实施例1

建立芯片杂交平台

探针设计自单基因病已知致病基因的外显子序列及外显子前后100bp,共7 万多个探针,其SEQ ID NO.、染色体坐标、捕获位置、长度和所涉及的疾病种 类见表4。

表4

实施例2

制备DNA文库

1.基因组DNA获得

取人的外周血,提取基因组DNA,获得3μg DNA。

2.DNA片段化

将抽提获得的人基因组DNA样品,在Covaris S2仪器(购自美国Covaris公 司)上进行片段化,最终打断成为主带在200bp的DNA双链片段的混合物,并将 片段进行纯化,纯化过程采用Ampure Beads方法,按照Agencourt AMPure  protocol进行(美国Beckman公司)。

3.DNA片段接头化

将DNA片段进行末端修复,成为带有平末端的片段混合物,并在每一条单 链的3′端添加一个“A”,以便于与带有“T”的接头相连,连接后进行纯化,纯 化方法采用Ampure Beads,按照Agencourt AMPure protocol(美国Beckman公 司)。纯化后,去除多余试剂如buffer、酶、ATP等,最终只剩余连有接头的DNA 片段组。

4.扩增DNA片段

由于连有接头的DNA样品浓度很低,需要进行扩增富集,PCR反应在 Bio-Rad公司的PTC-200PCR仪上运行。PCR扩增反应试剂的配置见表5。

PCR反应体系如下:98℃,30s;98℃变性15s,65℃退火30s,72℃延伸30s, 共扩增4-10个循环;最终72℃延伸5min。

表5

经扩增的DNA都带有接头,使用Ampure beads法,按照Agencourt AMPure  protocol的程序(美国Beckman公司)纯化PCR产物。

5.纯化的产物溶解于25μl纯水中,使用NanoDrop1000检测PCR产物浓度, 即构成DNA文库,DNA文库可在4℃保存数天,也可在-20℃保存数周,也可直 接用于后续程序。

实施例3

序列捕获

1.文库变性

将准备好的DNA样品置于SpeedVac中60℃蒸干,然后加入11.2μL的超纯 水,充分溶解。全速离心样品30秒,分别加入以下两种试剂:18.5μL的2×SC Hybridiation Buffer(购于美国Roche NimbleGen公司)和7.3μL的1×SC Hybridiation Component A(购于美国Roche NimbleGen公司)。震荡混匀后置于离 心机上全速离心30秒,然后于95℃使DNA充分变性,变性过程10分钟,得到单 链的带有接头的DNA文库。

2.杂交/序列捕获

将实施例1中带有相应探针的芯片固定在杂交仪(美国Roche NimbleGen公 司)上,将上一步骤变性后的样品加入芯片中,封闭芯片,于42℃杂交64小时。 在杂交体系中,基因芯片上探针分子的浓度要远远高于靶分子浓度。

杂交反应体系如表6所示:

表6

其中,Cot-1DNA可以很好地封闭来自基因组重复序列的非特异性杂交, 在最大程度上提高杂交的效率;PE Block 1.0和PE Block 2.0可以将实施例2中的 PE Primer1.0和PE Primer2.0封闭,避免非特异性捕获。

3.芯片洗涤与样品纯化

芯片洗涤与样品纯化根据美国Roche NimbleGen公司的试剂盒说明书进行, 具体步骤见表7。

表7

将NaOH洗脱液回收后用32μL的20%冰醋酸中和,中和液用德国Qiagen公 司的MinElute PCR Purification Kit进行纯化,得到捕获后的样品,最后溶解于 138μL纯水中。

实施例4

PCR扩增捕获的序列

由于捕获的含有特定序列的DNA片段浓度很低,需要进行PCR扩增每管的 反应体系为50μL,反应组分见表8。

表8

反应条件:

98℃预变性30s,98℃变性15s,62℃退火30s,72℃延伸30s,循环20次; 最终72℃延伸5min,可4℃静置过夜。

PCR产物使用Ampure Beads流程进行纯化。

完成后溶于50μl EB中,使用NanoDrop及Bioanalyzer 2100检测浓度。

实施例5

检测捕获序列的富集度

1.将稀释好的4种NSC Assay mix(购于美国Roche NimbleGen公司),根据试 剂盒内的说明书进行)取出在冰上溶解。将Non-Captured以及Captured LM-PCR 产物稀释至1ng/μl,最后体积>12μl。

2.在1.5ml的离心管中配制qPCR反应混合液,并分配转移至96孔qPCR反 应板中,向其中加入3μl稀释的1ng/μl LM-PCR产物,把所有的试剂和样品加完 后使用封口膜将平板封口,4000rpm离心2min。

3.将96孔板置于qPCR仪上,按说明书操作手册进行操作。

4.实验完成,整理分析qPCR试验数据,计算富集度(Enrichment),结果表 明,人基因组DNA样品(n=10)经实施例1-5所述方法处理后,其富集度均> 60,可用于后续测序。

实施例6

Solexa高通量测序及数据分析

PCR扩增产物的混合物与固相载体上固定的测序探针进行杂交,并进行固相 桥式PCR扩增,形成测序簇;对所述测序簇用“边合成-边测序法”进行测序,从而 得到样本中疾病相关核酸分子的核苷酸序列,包括步骤:

Solexa测序专用的测序芯片(flow cell)表面链接有一层单链引物,单链状态 的DNA片段与芯片表面通过碱基互补被一端“锚定”在芯片上;通过扩增反应的 单链DNA成为双链DNA;双链再次变性后成为单链,其一端“锚定”在测序芯片 上,另一端(5’或3’)随机和附近的另外一个引物互补,被“锚定”住,形成 “桥”(bridge);在测序芯片上同事有上千万DNA单分子发生以上的反应;形成的 单链桥,以周围的引物为扩增引物,在测序芯片表面再次进行扩增,形成双链;双 链经变性成单链,再次形成桥,成为下一轮扩增的模板继续扩增反应;在反复进行 30轮扩增,每个单分子得到了1000倍的扩增,成为单克隆“DNA簇群”;“DNA 簇群”在Solexa测序仪上进行序列分析;测序反应:“可逆性末端终止反应”提高 碱基合成来进行测序。四种碱基分别标记四种不同荧光,每个碱基末端被保护基团 封闭,单次反应只能加入一个碱基,经过扫描,读取该次反应颜色后,该保护基团 被除去,下一个反应可继续进行,如此反复,得出碱基的精确序列;自动读取碱基, 数据被转移到自动分析通道进行二次分析。

实施例7

用四种方法检测样本是否携带以下三种单基因病。

具体地,重复实施例1-5,其不同点在于测序法和接头连接区域。其不同点 和检测结果见表9。

表9

由表9可以看出,本发明的方法制得带有不同接头连接区的DNA文库,与 二代测序方法结合进行分析,通过Sanger法验证,表明本发明方法可以获得准 确的筛查结果。

实施例8

试剂盒制备

一种测定待检测样本中疾病相关核酸分子的核苷酸序列的试剂盒,包括组分:

(1)第一容器以及位于容器内的核酸芯片;

(2)第二容器以及位于容器内的接头;

(3)第三容器以及位于容器内的第一引物和/或第二引物;和第三引物和/或 第四引物;

(4)第四容器以及位于容器内的封闭分子;

(5)第五容器以及位于容器内的用于进行PCR扩增所需的试剂;

(6)第六容器以及位于容器内的用于进行封闭反应所需的试剂;

(7)第七容器以及位于容器内的用于杂交反应所需的试剂;

(5)检测说明书。

在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献 被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后, 本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申 请所附权利要求书所限定的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号