首页> 中国专利> 两核苷酸同时合成DNA测序方法及其应用

两核苷酸同时合成DNA测序方法及其应用

摘要

两核苷酸同时合成DNA测序方法及其应用,待测核酸序列由标记的核苷酸dATP、dGTP、dCTP、dUTP按照一定组合分成三组对同一模板进行三次测序:每组测序由包含四个标记的核苷酸dATP、dGTP、dCTP、dUTP,按照每个核苷酸在一个循环中只使用一次的方式,进行两次由两个不同标记核苷酸同时合成测序反应的循环,每进行一次测序反应得到由核苷酸(碱基)片段构成的一个编码,若干次测序反应后得到由一组若干编码构成的核酸序列信息;当该组测序反应完成后,通过变性将测序引物延伸链清除,重新杂交测序引物,进行下一组测序反应,最后将三组测序反应获得的三组编码信息,通过解码转化成对应的三组核苷酸(碱基)片段信息,并通过比较三组核苷酸(碱基)信息组装出待测核酸序列的具体碱基信息。

著录项

  • 公开/公告号CN102329884A

    专利类型发明专利

  • 公开/公告日2012-01-25

    原文格式PDF

  • 申请/专利权人 东南大学;

    申请/专利号CN201110321795.2

  • 发明设计人 陆祖宏;肖鹏峰;

    申请日2011-10-20

  • 分类号C12Q1/68(20060101);C12R1/19(20060101);

  • 代理机构32200 南京经纬专利商标代理有限公司;

  • 代理人李纪昌

  • 地址 210096 江苏省南京市玄武区四牌楼2号

  • 入库时间 2023-12-18 04:25:54

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-12-08

    未缴年费专利权终止 IPC(主分类):C12Q1/68 授权公告日:20130508 终止日期:20161020 申请日:20111020

    专利权的终止

  • 2013-05-08

    授权

    授权

  • 2012-03-14

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20111020

    实质审查的生效

  • 2012-01-25

    公开

    公开

说明书

技术领域

本发明属于生物技术领域,是一种实现核酸序列高通量测定的方法,具体涉 及一种两核苷酸同时合成的编码、解码核酸序列测定方法及其应用。

背景技术

随着人类基因组计划和各种模式生物基因组计划的开展和完成,使人类步入 了后基因时代,对当代的生物学研究和医学研究产生了巨大的影响,分子生物学 相关学科得到了迅猛的发展。从基因水平上认识生命的差异,疾病发生、发展的 规律,以及药物与生命体的相互作用将成为可能。就基因序列分析而言,后基因 时代的重点已由全基因组序列测定转移到了对基因组中个体遗传差异及物种间 遗传差异的比较。目前,无论是找寻新的还是确认已知SNP位点,传统的Sanger DNA测序法,仍处于无可替代的地位。但这一方法存在通量低和价格高的问题。 第一个人类基因组序列测定的费用大约为10亿美元,虽然目前这一费用已经大大 降低,但功能基因组的研究进展仍然受限于DNA测序技术。为此,美国Venter 基金会在2003年提出了1000美金人类全基因组测序的研究目标。美国国立卫生研 究院人类基因组研究中心主任Collins教授指出:大幅度降低DNA测序的成本将会 大大推动生命科学和医学的研究,甚至会带来革命性的变化。目前,全基因组 DNA测序技术已经成为国际上一个竞争十分激烈的研究领域。如Roche公司基于 乳液PCR产物的高通量并行焦测序技术;Illumina公司的桥式扩增-DNA芯片延伸 测序技术;以及Applied Biosestems公司基于乳液PCR产物的杂交-酶连接-酶切割 的SOLiD平台、pH敏感场效应管阵列芯片的Ion Torrent平台等高通量测序技术都 有成熟的商品化仪器上市。

聚合酶链式反应(PCR)表明合成延伸反应理论上合成测序方法可以测定数 千甚至上万个碱基,这无疑代表高通量核酸测序的巨大潜力。然而现有的合成测 序要么是简单地每次只加一种核苷酸的方法通过确定每次合成的碱基的个数,或 者通过可逆封闭核苷酸单体3端羟基的特殊单体一次只延伸一个核苷酸的方法确 定每次合成的碱基种类的来实现的。前者,要么每个模板需要独立的“反应池” 而使得测序通量大大降低,要么是需要四个独立的反应来完成所有模板的一个碱 基的测定而增加测序时间;后者由于在测定下一个碱基前需要将3端羟基的保护 基团脱出,而每增加一步反应将导致反应效率的降低,最终导致测序长度的下降。

本发明的目的就是通过一种两核苷酸同时合成的编码、解码核酸序列的测定 方法,每组测序由包含四个标记的核苷酸A、G、C、T,按照每个核苷酸在一个 循环中只使用一次的方式,进行两次由两个不同标记核苷酸同时合成测序反应的 循环,每进行一次合成测序反应得到由核酸片段构成的一个编码,核酸片段的编 码按照核苷酸的标记物和标记物的强度进行,一个序列片段对应一个编码,并用 一个专属的符号表示,编码包括单个标记物对应的单个碱基字符、由两个不同标 记物构成的两个碱基字符串,称之为母码,表示标记物或者碱基的种类码;以及 由标记物强度反映的核苷酸个数构成,称之为子码,表示标记物强度对应的碱基 个数码;若干次测序反应后得到由编码构成的核酸序列信息。当该组测序反应完 成后,通过变性将测序引物延伸链清除,重新杂交测序引物,进行下一组测序反 应;最后将三组测序反应获得的三组编码信息,通过解码转化成三组核酸片段信 息,并通过比较三组核酸片段信息组装出待测核酸序列的具体碱基信息。

发明内容

解决的技术问题:本发明的目的是提供一种基于两种3’端羟基非封闭核苷 酸的同时合成测序方法来实现核酸序列的高通量测定,本发明有助于降低测定成 本,具有方法简单的优点。

技术方案:一种两核苷酸同时合成DNA测序方法,待测核酸序列由标记的 核苷酸dATP、dGTP、dCTP、dUTP按照一定组合分成三组对同一模板进行三次 测序:每组测序由包含四个标记的核苷酸dATP、dGTP、dCTP、dUTP,按照每 个核苷酸在一个循环中只使用一次的方式,进行两次由两个不同标记核苷酸同时 合成测序反应的循环,每进行一次合成测序反应得到由核酸片段构成的一个编 码,核酸片段的编码包括按照核苷酸的标记物和标记物的强度进行,一个序列片 段对应一个编码,并用一个专属的符号表示,编码包括单个标记物对应的单个碱 基字符、由两个不同标记物构成的两个碱基字符串,称之为母码,表示标记物或 者碱基的种类码;以及由标记物强度反映的核苷酸个数构成,称之为子码,表示 标记物强度对应的碱基个数码;若干次测序反应后得到由若干个编码构成的核酸 序列信息。当该组测序反应完成后,通过变性将测序引物延伸链清除,重新杂交 测序引物,进行下一组测序反应;最后将三组测序反应获得的三组编码信息,通 过解码转化成对应的三组核苷酸(碱基)片段信息,并通过比较三组核酸片段信 息组装出待测核酸序列的具体碱基信息。

标记核苷酸与相同的非标记核苷酸是按1∶1000~1∶1的摩尔比例参与进行 合成测序反应的,其标记物是荧光染料或量子点,可以通过光学等检测获得标记 物种类和强度信号的物质。

核苷酸的标记物与核苷酸母体是通过含二硫键或酰胺键等的连接臂连接,并 可以通过β-巯基乙醇或紫外光的辐射切割二硫键、酰胺键等而将标记物从测序合 成链中清除。

核苷酸标记物可以通过光、或者化学漂白的方式将标记物特性消除。

待测核酸序列的解码是将每一组合成测序得到的一组编码信息,通过查阅编 码表转换为碱基个数或者碱基序列片段的信息。

待测核酸序列的组装是通过比较三组的合成测序得到明确碱基序列片段的 信息,按照测序的顺序确定出具体的碱基信息。

两核苷酸同时合成DNA测序方法,步骤为:

a.全基因组模板制备:将目标基因组用超声破碎成大小为100-500碱基的片 段,并在连接酶的作用下将这些片段化核酸序列用一对通用连接子进行连接,并 进行预扩增10个循环;然后凝胶电泳切割160-200bp DNA片段,并纯化,将这 些160-200bp DNA片段与固定其中一个连接子互补序列的微珠进行乳液并行 PCR反应,扩增片段化的目标基因组,并将这些扩增双链DNA模板的微珠固定 到平板基片上,通过变性得到目标基因组测序DNA模板;

b.测序引物杂交:将5’端固定的模板与能和3’端连接子互补的引物杂交, 杂交引物作为所有目标基因组DNA模板的测序引物;

c.将Cy3-S-S-dNTPs和Cy5-S-S-dNTPs按照下述的方式进行两核苷酸同时 合成循环测序:

一组-1:Cy3-S-S-dATP、Cy5-S-S-dGTP;一组-2:Cy3-S-S-dCTP、 Cy5-S-S-dUTP;

二组-1:Cy5-S-S-dATP、Cy5-S-S-dCTP;二组-2:Cy3-S-S-dUTP、 Cy5-S-S-dGTP;

三组-1:Cy3-S-S-dATP、Cy5-S-S-dUTP;三组-2:Cy3-S-S-dCTP、 Cy5-S-S-dGTP;

I)在第一组测序反应中,首先按照摩尔比Cy3-S-S-dATP/dATP=1∶300、 Cy5-S-S-dGTP/dGTP=1∶500的比例将两核苷酸加入,在0.25U/μL Klenow聚合 酶作用下反应5分钟,然后用含0.2%wtTrion X-100和2%wt SSC-0.1%wt SDS 的缓冲液1洗涤,最后用CCD成相,得到该次测序反应的荧光种类和强度信息 的编码;II)50mM的巯基乙醇在37℃下处理10分钟,将二硫键切割,清除荧 光基团;III)按照摩尔比Cy3-S-S-dCTP/dCTP=1∶100、Cy5-S-S-dUTP/dUTP=1∶ 100的比例将两核苷酸加入,在0.25U/μL Klenow聚合酶作用下反应5分钟,然 后用含0.2%wtTrion X-100和2%wt SSC-0.1%wt SDS的缓冲液1洗涤,最后用 CCD成相,得到该次测序反应的荧光种类和强度信息;IV)50mM的巯基乙醇 在37℃下处理10分钟,将二硫键切割,清除荧光基团;V)循环步骤(II)-- (IV),直到获得所需核酸片段相应编码构成的序列信息;

d.用8M尿素在75℃下处理5分钟,将第一组测序反应中的测序引物、及 其测序引物合成链清除,重新得到单链DNA模板;

e.更换两核苷酸组合,按照上述a-d的布置分别将第二、三组的两核苷酸 同时合成循环测序,分别得到第二、三组核酸片段编码构成的序列信息;

f.按照编码对应核酸片段的方式,分别将每个模板第一、第二、三组行两核 苷酸同时合成循环测序的编码信息转化为碱基片段信息;

g.将每个模板第一、第二、三组的碱基片段信息,分别组装成碱基序列信 息,将所有模板的碱基序列信息,分别组装得到目标基因组序列。

上述两核苷酸同时合成DNA测序方法是在滚环、桥式或乳液扩增技术获得 的DNA模板的高通量合成测序中的应用。

表1

表1是本发明一种两核苷酸同时合成DNA测序方法的一种分组方法。将标 记核苷酸dATP、dGTP、dCTP、dUTP分成三组,即第一组为核苷酸dATP、dGTP (碱基A、G标记不同的标记物),核苷酸dCTP、dUTP(碱基C、T标记不同 的标记物)分别进行两核苷酸同时合成测序反应的循环;第二组为核苷酸dATP、 C(碱基A、C标记不同的标记物),核苷酸dGTP、dUTP(碱基G、T标记不 同的标记物)分别进行两核苷酸同时合成测序反应的循环;第三组为核苷酸碱基 dATP、dUTP(碱基A、T标记不同的标记物),碱基dCTP、dGTP(碱基C、G 标记不同的标记物)分别进行两核苷酸同时合成测序反应的循环。

表2

表2是本发明两核苷酸同时合成DNA测序方法按照表1所述的分组方法对 合成测序核酸片段的一种编码方式。表中d13序列片段(ACCC)的所有序列片 段集合,即ACCC、CACC、CCAC、CCCA,其余类推。

表3

表3为本发明一种两核苷酸同时合成DNA测序方法按照表1所述的分组方 法、表2所述的编码方式,对图2包含的具体序列 (3’-TAATCAGGTCCCATTTTGGCCTA-5’)进行的三组合成测序反应测序中每 次具体测序反应所获得的编码信息。其中第一、二、三组表示同一引物对模板DNA 的三次独立测序反应;AG/TC,AC/TG,AT/CG表示第一、二、三组独立测序 反应中分别由不同标记的两核苷酸同时合成测序反应的循环;每次不同标记的两 核苷酸的合成测序得到的信息由编码表示;5、5、5、5、4、4次反应分别表示 第一、二、三组中AG、TC,AC、TG,AT、CG不同标记的两核苷酸合成测序 的反应次数。

有益效果:

本发明应用3’端羟基非封闭标记核苷酸A、G、C、T分成三组对同一模板 进行三次测序,每组测序由包含四个标记的核苷酸A、G、C、T,按照每个核苷 酸在一个循环中只使用一次的方式,进行两次由两个不同标记核苷酸同时合成测 序反应的循环,每进行一次测序反应得到由核苷酸(碱基)片段构成的一个编码, 若干次测序反应后得到由一组若干编码构成的核酸序列信息;当该组测序反应完 成后,通过变性将测序引物延伸链清除,重新杂交测序引物,进行下一组测序反 应,最后将三组测序反应获得的三组编码信息,通过解码转化成对应的三组核苷 酸(碱基)片段信息,并通过比较三组核苷酸(碱基)信息组装出待测核酸序列的具 体碱基信息。

1.本发明的最大优点是可以直接采用商品化、无专利保护的3’端羟基非封 闭核苷酸进行合成测序,可以大大提高序列测定的长度,同时大大降低了测序成 本。

2.本发明按照核苷酸分成组的形式进行编码,编码和解码容易。

3.本发明适用面广。可以用于单分子模板、(单分子)多拷贝DNA模板的 测序,也可以在现有测序仪器上实现。

4.本发明方法简单,所涉及的方法均能够通过现有成熟技术来实现。

附图说明

以下将结合附图对本发明作进一步说明。

图1是本发明两核苷酸同时合成DNA测序方法按照表1所述的分组方法, 对同一DNA模板进行三组测序的流程。其中,1为待测序DNA模板,1-1,1-2 为连接在待测序DNA模板两段的序列已知的连接子,2为载体,3为测序引物, F1、F2分别为标记在核苷酸上的不同标记物。测定反应包括三组:

第一组测序反应:待测序DNA模板(1)的5’端固定在载体(2)上,测序 引物(3)与固定的DNA模板(1)杂交(a),首先按照1∶1000~1∶1,最佳 为1∶550~1∶350的比例的F1-dATP/dATP、F2-dGTP/dGTP将两核苷酸加入, 在聚合酶作用下反应(b),在缓冲液洗涤、清除未反应的核苷酸后,进行成像(c), 得到该次测序反应的荧光种类和强度信息的编码(其中F1表示碱基A、F2表示 碱基G,而荧光强度最后通过比较相同模板上不同次数的测序强度最后转化为碱 基个数:如焦测序中的荧光强度转化为碱基个数);加入切割试剂或者将荧光漂 白(d)清除荧光基团;按照1∶1000~1∶1,最佳为1∶150~1∶50的比例的 F1-dCTP/dCTP、F2-dUTP/dUTT将两核苷酸加入,在聚合酶作用下反应(e),在 缓冲液洗涤、清除未反应的核苷酸后,进行成像(f),得到该次测序反应的荧光 种类和强度信息的编码(其中F1表示碱基C、F2表示碱基T,而荧光强度最后 通过比较相同模板上不同次数的测序强度最后转化为碱基个数:如焦测序中的荧 光强度转化为碱基个数);加入切割试剂或者将荧光漂白(g)清除荧光基团;然 后按照上述方式进行循环测序反应(h),每增加一次循环边多产生2个相应的编 码,最后得到该组反应由若干编码构成的序列信息。

然后变性(i),将第一组测序反应中的测序引物、及其测序引物合成链清除, 重新得到单链DNA模板。

第二组测序反应:重新杂交(a)测序引物(3)于固定的DNA模板(1) 上,更换两核苷酸组合(即:F2-dATP/dATP、F1-dCTP/dCTP;F1-dUTP/dUTP、 F2-dGTP/dGTP),按照第一组测序反应的方式进行,得到该组反应由若干编码构 成的序列信息。

然后变性(i),将第一组测序反应中的测序引物、及其测序引物合成链清除, 重新得到单链DNA模板。

第三组测序反应:重新杂交(a)测序引物(3)于固定的DNA模板(1) 上,更换两核苷酸组合(即:F1-dATP/dATP、F2-dUTP/dUTP;F1-dCTP/dCTP、 F2-dGTP/dGTP,按照第一组测序反应的方式进行,得到该组反应由若干编码构 成的序列信息。

图2是本发明一种两核苷酸合成编码核酸测序方法按照表1所述的分组方 法、表2所述的编码方式,对包含3’-TAATCAGGTCCCATTTTGGCCTA-5’的待 测核酸序列,其中模板1固定在载体2上,测序引物3与模板1完全互补杂交, 测序反应从测序引物的5’端向3’合成。

图3是本发明一种两核苷酸合成编码核酸测序方法根据表3中三组合成测序 反应分别获得的编码信息,其中1、2、3分别为第一、二、三组测序反应的编码 通过查表2中编码核酸片段的对应关系转化的相应序列片段信息。按照测序的顺 序,并通过比较三组核酸片段信息的先后顺序、组装出待测核酸序列的具体碱基 信息为ATTAGTCCAGGGTAAAACCGGAT,即为待测核酸序列 3’-TAATCAGGTCCCATTTTGGCCTA-5’的互补序列。

具体实施方式

实施例1:大肠杆菌基因组的两核苷酸合成编码核酸测序

全基因组模板制备:将大肠杆菌基因组用超声破碎成大小为100-500碱基的 片段,并在连接酶的作用下将这些片段化核酸序列用一对序列已知道的通用连接 子(如:连接子1的序列为:CTG CTG TAC CGT ACA GCC TTG GCC G;连接 子2的序列为:CGC TTT CCT CTC TAT GGG CAG TCG GTGA T)进行连接, 并进行预扩增10个循环;然后凝胶电泳切割160-200bp DNA片段,并纯化。将 这些160-200bp DNA片段与固定其中一个连接子互补序列的微珠进行乳液并行 PCR反应,扩增片段化的大肠杆菌基因组。并将这些扩增双链DNA模板的微珠 固定到平板基片上,通过变性得到大肠杆菌基因组测序DNA模板。

1.测序引物杂交:将5’端固定的模板与能和3’端连接子互补的引物杂交, 杂交引物作为所有大肠杆菌基因组DNA模板的测序引物(为了保证每个模板每 次均能发生合成反应,我们将测定连接子上的一个已知碱基序列,并在每组测序 反应中的第一次两核苷酸测序反应中包含其互补碱基,如在该实例中连接子中已 知碱基为T,每组测序反应中的第一次两核苷酸测序反应中均包标记的dATP)。

3.将Cy3-S-S-dNTPs和Cy5-S-S-dNTPs(可从Perkin-Elmer、Applied  Biosestems等公司购买),或者自己合成能够切割的标记核苷酸,按照表4的方 式进行两核苷酸同时合成循环测序:

表4

(1)在第一组测序反应中,首先按照Cy3-S-S-dATP/dATP=1∶300(0.1μM∶ 30μM)、Cy5-S-S-dGTP/dGTP=1∶500(0.1μmM∶5μmM)比例将两核苷酸加入, 在0.25U/μL Klenow聚合酶作用下反应5分钟,然后用缓冲液1(0.2%Trion X-100, 2%SSC-0.1%SDS)洗涤,最后用CCD成相,得到该次测序反应的荧光种类和 强度信息的编码(其中Cy3表示碱基A、Cy5表示碱基G,而荧光强度最后通过 比较相同模板上不同次数的测序强度最后转化为碱基个数:如焦测序中的荧光强 度转化为碱基个数)。

(2)50mM的巯基乙醇在37℃下处理10分钟,将二硫键切割,清除荧光 基团;

(3)按照Cy3-S-S-dCTP/dCTP=1∶100(0.1μM∶10μM)、 Cy5-S-S-dUTP/dUTP=1∶100(0.1μM∶10μM)的比例将两核苷酸加入,在 0.25U/μL Klenow聚合酶作用下反应5分钟,然后用缓冲液1(0.2%Trion X-100, 2%SSC-0.1%SDS)洗涤,最后用CCD成相,得到该次测序反应的荧光种类和 强度信息(其中Cy3表示碱基C、Cy5表示碱基T,而荧光强度最后通过比较相 同模板上不同次数的测序强度最后转化为碱基个数:如焦测序中的荧光强度转化 为碱基个数);

(4)50mM的巯基乙醇在37℃下处理10分钟,将二硫键切割,清除荧光 基团;

(5)循环步骤(2)--(5),如进行40次两核苷酸同时合成循环测序,则 得到40个核酸片段相应编码构成的序列信息。

4.用8M尿素在75℃下处理5分钟(2次),将第一组测序反应中的测序引 物、及其测序引物合成链清除,重新得到单链DNA模板。

5.按照表4的更换两核苷酸组合,按照上述1-4的布置分别将第二、三组 的两核苷酸同时合成循环测序,分别得到第二、三组编码构成的序列信息。

6.按照表2编码对应核酸片段的方式,分别将每个模板第一、第二、三组 两核苷酸同时合成循环测序的编码信息转化为碱基片段信息。

7.通过比较每个模板第一、第二、三组的碱基片段信息,并结合测序的顺 序,将每个模板第一、第二、三组的碱基片段信息组装出待测核酸序列的具体碱 基信息。

8.将所有模板的碱基序列信息,分别组装成大肠杆菌基因组序列。

序列表

 

<110>  东南大学

 

<120>  两核苷酸同时合成DNA测序方法及其应用

 

<130> 

 

<160>  4    

 

<170>  PatentIn version 3.3

 

<210>  1

<211>  23

<212>  DNA

<213>  人工序列

 

<400>  1

taatcaggtc ccattttggc cta                                             23

 

 

<210>  2

<211>  23

<212>  DNA

<213>  人工序列

 

<400>  2

attagtccag ggtaaaaccg gat                                             23

 

 

<210>  3

<211>  25

<212>  DNA

<213>  人工序列

 

<400>  3

ctgctgtacc gtacagcctt ggccg                                           25

 

 

<210>  4

<211>  29

<212>  DNA

<213>  人工序列

 

<400>  4

cgctttcctc tctatgggca gtcggtgat                                       29

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号