首页> 中国专利> 一种特殊修饰的核苷酸及其在高通量测序方面的应用

一种特殊修饰的核苷酸及其在高通量测序方面的应用

摘要

本发明公开一种特殊修饰的核苷酸及其在高通量测序方面的应用,该核苷酸的荧光标记基团与核苷酸母体是通过含邻二醇键的连接臂连接,通过强氧化剂氧化邻二醇羟基,使得邻碳的单键断开,简单有效地实现荧光基团的化学切割,对同一待测序列模板进行两组或两组以上的测序反应,每次测序由两对不同荧光标记的两种核苷酸dNTPs循环组成,按照每种核苷酸在一个循环中只使用一次的方式,每进行一次测序反应得到由核苷酸片段构成一个编码,反应后得到由一组若干编码构成的核酸序列信息;当该组测序反应完成后,进行第二组测序反应,得到第二组测序反应排列的若干编码信息;并结合测序的顺序来解码两组编码信息,组装出待测核酸片段的具体碱基序列。

著录项

  • 公开/公告号CN103951724A

    专利类型发明专利

  • 公开/公告日2014-07-30

    原文格式PDF

  • 申请/专利权人 南京普东兴生物科技有限公司;

    申请/专利号CN201410182876.2

  • 发明设计人 戴琳超;朱会英;陆祖宏;

    申请日2014-04-30

  • 分类号C07H19/14;C07H19/10;C12Q1/68;

  • 代理机构南京苏高专利商标事务所(普通合伙);

  • 代理人孙承尧

  • 地址 210000 江苏省南京市江宁区高新园生命科学加速带乾德路2号

  • 入库时间 2024-02-20 00:15:49

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-04-07

    未缴年费专利权终止 IPC(主分类):C07H19/14 专利号:ZL2014101828762 申请日:20140430 授权公告日:20170215

    专利权的终止

  • 2017-02-15

    授权

    授权

  • 2014-08-27

    实质审查的生效 IPC(主分类):C07H19/14 申请日:20140430

    实质审查的生效

  • 2014-07-30

    公开

    公开

说明书

技术领域

本发明属于生物技术领域,是一种实现核酸序列高通量测定的方法,具体涉及一种 特殊修饰的核苷酸及其在高通量测序方面的应用。

背景技术

DNA测序技术是分子生物学研究中最常用的技术,它的出现极大地推动了生物学 的发展。成熟的DNA测序技术始于20世纪70年代中期。1977年Maxam和Gilbert报道了通 过化学降解测定DNA序列的方法。同一时期,Sanger发明了双脱氧链终止法。20世纪90 年代初出现的荧光自动测序技术将DNA测序带入自动化测序的时代。这些技术统称为第 一代DNA测序技术。最近几年发展起来的第二代DNA测序技术则使得DNA测序进入了高 通量、低成本的时代。高通量测序技术是对传统测序技术的一次革命性提高,一次能同 时对几百万甚至几千万条DNA序列进行测序,因此也被称为第二代测序技术或下一代 测序技术NGS,同时高通量测序技术也使得对一个物种的整体转录组和基因组进行全面 的分析成为了可能,所以又被称为深度测序。目前主流的高通量测序技术主要有三个代 表:Roche公司的454测序技术、Illumina公司的Solexa测序技术以及ABI公司的SOLiD测序 技术。

三种主流测序平台都有受限之处,454测序技术最大的优势在于较长的读长,然 而454测序技术的成本比其它几种测序技术高出很多,这限制了它的应用。ABI公司的 SOLiD测序技术的准确性非常高,但由于采用的是连接法测序,其测序的速度与长度都 比其他几种测序技术要逊色不少。Illumina公司的Solexa测序技术可以说是目前全球公 认的通量最高、应用最广泛的高通量测序技术。Solexa测序技术采用了边合成边测序的 方法,在合成反应中,加入改造过的DNA聚合酶和带有4种荧光标记的dNTP,采集4色荧 光之后,将3’端阻遏基团切除,还原为羟基,随后进行第二次循环,重复第一个循环的 步骤,直到模板序列全部被合成双链DNA。由于3’端阻遏基团的保护而使每次仅延伸一 位碱基,增加了测序的时间,并且由于3’端阻遏基团的存在,其对于聚合酶的要求非常 之高,这也限制了它的读长,增加了它的成本。

《两核苷酸同时合成DNA测序方法》中提出了一种两核苷酸同时合成的编码、解 码核酸序列的测定方法及其应用,但由于其核苷酸合成难度较高,不确定性太大,市面 上未有成熟的产品。

发明内容

发明目的:针对上述现有技术存在的问题,本发明的目的是提供一种特殊修饰的核 苷酸及其在高通量测序方面的应用。本发明也是利用合成测序的原理,使用特殊修饰的 核苷酸测序方法实现核酸序列的高通量测序,本发明提供了一种新型的可化学切割的核 苷酸,有助于降低测序成本、简化测序流程并缩短测序时间。

技术方案:为实现上述目的,本发明通过下述技术方案实现:一种特殊修饰的核苷 酸,所述核苷酸的化学结构式如下,该核苷酸由Firebird Biomelecular Sciences公司合成:

其中,n=1或2,R表示dATP、dTTP、dCTP、dGTP中任意一种,当n=1时,得到 Cy3-dNTP-diol-NH2的化学结构式,当n=2时,得到Cy5-dNTP-diol-NH2的化学结构式。

上述的核苷酸的荧光标记基团与核苷酸母体是通过含邻二醇键的连接臂连接,并可 以通过高碘酸钠或高锰酸钾等强氧化剂氧化邻二醇羟基,使得邻碳的单键断开,简单有 效地实现化学切割而将荧光标记基团切除出去。

其中,特殊修饰的核苷酸dNTPs-diol-NH2的具体的化学结构式如下:

1、Cy5-dATP-diol-NH2化学结构式:

2、Cy5-dUTP-diol-NH2化学结构式:

3、Cy5-dCTP-diol-NH2化学结构式:

4、Cy5-dGTP-diol-NH2化学结构式:

5、Cy3-dATP-diol-NH2化学结构式

6、Cy3-dUTP-diol-NH2化学结构式

7、Cy3-dCTP-diol-NH2化学结构式

8、Cy3-dGTP-diol-NH2化学结构式

本发明还保护一种特殊修饰的核苷酸在高通量测序方面的应用。

本发明还保护一种特殊修饰的核苷酸的高通量测序方法,包括以下步骤:待测核酸 序列由上述的两种不同荧光标记的核苷酸Cy3-dNTP-diol-NH2和Cy5-dNTP-diol-NH2按照 一定的组合分成两组或两组以上,对同一待测核酸序列模板进行两组或两组以上的测序 反应,每组测序反应由上述两组或两组以上不同荧光标记的两种核苷酸循环组成,按照 每种核苷酸在一个循环中只使用一次的方式,每进行一次测序反应得到由核苷酸片段构 成的一个编码,测序反应后得到由一组若干编码构成的核酸序列信息;当该组测序反应 完成后,使用变性溶液使双链变性,将测序引物延伸链清除,然后重新杂交测序引物, 进行后一组的测序反应,得到后一组测序反应排列的若干编码信息;然后通过解码两组 或两组以上的若干编码信息,组装出待测核酸片段的具体碱基序列。

其中,上述两种不同荧光标记的核苷酸是指由(Cy3-dUTP-diol-NH2+ Cy5-dCTP-diol-NH2)、(Cy3-dGTP-diol-NH2+Cy5-dATP-diol-NH2)、(Cy5-dUP-diol-NH2+ Cy3-dGTP-diol-NH2)、(Cy3-dATP-diol-NH2+Cy5-dCTP-diol-NH2)、(Cy3-dUTP-diol-NH2+ Cy5-dATP-diol-NH2)、(Cy3-dCTP-diol-NH2+Cy5-dGTP-diol-NH2)六种组合中任一组两种核苷 酸同时进行的合成测序反应。

其中,待测核酸序列的解码是通过解码两组或两组以上按照测序顺序排列的若干碱 基编码序列,组装出待测核酸片段的具体碱基序列信息。其中,待测核酸序列的解码是 通过解码两组或两组以上按照测序顺序排列的若干碱基编码序列,组装出待测核酸片段 的具体碱基序列信息。待测核酸序列的解码是将每一组合成测序得到的一组编码信息, 通过分析荧光信号种类和强度,转换为碱基序列和个数等信息。待测核酸序列的组装是 通过比较两组或两组以上的合成测序得到明确碱基序列片段的信息,按照测序的顺序确 定出具体的碱基信息,具体解码方法参考《两核苷酸同时合成DNA测序方法及其应用》 中。

荧光标记的核苷酸与普通核苷酸是按50:1的摩尔比例进行合成测序反应的,这种 比例更适合长序列的延伸与荧光信号的检测,可以通过光学检测获得荧光的种类和强度 信号。

一种特殊修饰的核苷酸的高通量测序方法,具体步骤为:

a)测序模板制备:利用超声波方法将目的基因组打碎成100-500bp的碱基片段, 在连接酶的作用下将DNA片段两端加上一对通用连接子P1、P2;然后凝胶电泳切割 180-220bp DNA片段并纯化,并进行8个循环的预扩增得到DNA片段;然后将这些预扩 增好的DNA片段与其中一个连接子互补序列的磁珠进行乳液PCR反应,得到大量有目 的基因组DNA片段的单克隆磁珠,并变性得到基因组测序模板,最后将这些扩增有目 的基因组DNA片段的单克隆磁珠固定在微流控芯片上;

b)测序引物杂交:将单克隆磁珠上的模板链与能和3’端连接子互补的引物杂交, 杂交引物作为模板DNA的测序引物;为了保证每个模板均能发生合成反应,我们将测 定连接子上的一个已知碱基序列,并在每组测序反应中的第一个二核苷酸测序反应中包 含其互补碱基,如连接子已知碱基为A,每组测序反应中的第一次二核苷酸测序反应中 均包含标记的dUTP-diol-NH2

P1:5’-CCACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGAT-3’

3’-TTGGTGATGCGGAGGCGAAAGGAGAGATACCCGTCAGCCACTA-5’

P2:5’-CTGCCCCGGGTTCCTCATTCTCT-3’

3’-TTGACGGGGCCCAAGGAGTAAGAGA-5’

PCR Primer1:5’-CCACTACGCCTCCGCTTTCCTCTCTATG-3’

PCR Primer2:5’-CTGCCCCGGGTTCCTCATTCT-3’

PCR Primer1、PCR Primer2在进行8个循环的预扩增得到DNA片段中采用。

c)测序:将Cy3-dNTPs-diol-NH2和Cy5-dNTPs-diol-NH2选择下述方式的任意两组或 三组进行组合两核苷解码循环测序:如1组-1、1组-2、2组-1、2组-2;或1组-1、1组 -2、3组-1、3组-2,或1组-1、1组-2、2组-1、2组-2、3组-1、3组-2;

1组-1:Cy3-dUTP-diol-NH2+Cy5-dCTP-diol-NH2

1组-2:Cy3-dGTP-diol-NH2+Cy5-dATP-diol-NH2

2组-1:Cy5-dUTP-diol-NH2+Cy3-dGTP-diol-NH2

2组-2:Cy3-dATP-diol-NH2+Cy5-dCTP-diol-NH2

3组-1:Cy3-dUTP-diol-NH2+Cy5-dATP-diol-NH2

3组-2:Cy5-dGTP-diol-NH2+Cy3-dCTP-diol-NH2

c1)在第一组测序反应中,首先按照Cy3-dUTP-diol-NH2/dTTP=50:1、 Cy5-dCTP-diol-NH2/dCTP=50:1的摩尔比例将四种核苷酸加入,在0.2U/μl9°N DNA聚合 酶(New England Biolabs公司购买)的作用下反应5分钟,然后用含0.01%wt Trion X-100、 20%wt甘油的缓冲液1洗涤,最后用CCD成相,得到此次测序反应的荧光种类和强度信 息的编码;

c2)用50mM的高碘酸钠或高猛酸钾室温将第一组测序反应中的测序引物、及其测 序引物合成链处理5分钟,氧化邻二醇羟基使得邻碳的单键断开,清除荧光基团;

c3)按照Cy3-dGTP-diol-NH2/dGTP=50:1、Cy5-dATP-diol-NH2/dATP=50:1的摩尔比 例将四种核苷酸加入,在0.2U/μl9°N DNA聚合酶作用下反应5分钟,然后用含0.01%wt Trion X-100、20%wt甘油的缓冲液1洗涤,最后用CCD成相,得到该次测序反应的荧光 种类和强度信息;

c4)用50mM的高碘酸钠或高猛酸钾室温处理5分钟,氧化邻二醇羟基,使得邻碳 的单键断开,清除荧光基团;

c5)循环步骤c1)—c4)若干次,直到获得所需核酸片段相应编码构成的序列信息;

c6)用含0.005M NaOH和65%wt甲酰胺的缓冲液2在65℃下处理10分钟,将第一组 测序反应中的测序引物、及其测序引物合成链清除,重新得到单链DNA模板,然后与测 序引物进行杂交反应,然后更换核苷酸的组合,按照上述c1)-c5)的步骤将第二组的 核苷酸循环测序,得到第二组核酸片段编码构成的序列信息;若继续即可进行第三组的 核苷酸循环测序;进行第三组核苷酸循环测序可以提高测序准确率;

d)按照编码对应核酸片段的方式,分别将每个模板第一、第二组和/或第三组核苷 酸循环测序的编码信息转化为碱基片段信息;

e)通过比较每个模板第一、第二组和/或第三组的碱基片段信息,并结合测序的顺 序,将每个模板第一、第二组和/或第三组的碱基片段信息组装出待测核酸序列的具体 碱基信息。

f)将所有模板的碱基序列信息,分别组装成目标基因组序列。

表1

表1是本发明一种特殊修饰的核苷酸及其在高通量测序方面的应用分组方法对合成 测序核酸片段的一种编码方式。表中5的子码Tn Cm或Cn Tm,当n=2,m=2时,表示 TTCC、CCTT、TCCT、CTTC、TCTC、CTCT所有序列的集合,其余以此类推。

有益效果:本发明利用一种特殊修饰的核苷酸,由Firebird Biomelecular Sciences公 司合成,技术成熟可靠,其荧光标记基团与核苷酸母体是通过含邻二醇键的连接臂连接, 可以直接使用高碘酸钠或高锰酸钾等强氧化剂氧化邻二醇羟基,使得邻碳的单键断开, 更加简单有效地实现化学切割而将荧光标记基团切除,从而可以在高通量测序中应用。 这种特殊修饰的核苷酸测序方法采用的是解码测序方法,利用边合成边测序的原理,而 不是连接测序原理,一次反应加入两种核苷酸,并且实现荧光基团的化学切割,更加简 单易行、效率高、成本低。将由荧光标记的核苷酸dNTPs-diol-NH2按照一定的组合,分 成两组或两组以上对同一待测序列模板进行两组或两组以上进行测序反应,每次测序由 两对不同荧光标记的两种核苷酸dNTPs循环组成,按照每种核苷酸在一个循环中只使用 一次的方式,每进行一次测序反应得到由核苷酸片段构成一个编码,若干次反应后得到 由一组若干编码构成的核酸序列信息;当该组测序反应完成后,使用变性溶液使双链变 性,将测序引物延伸链清除,然后重新杂交测序引物,进行第二组测序反应,得到第二 组测序反应排列的若干编码信息;若有需要可进行第三组测序反应以提高测序准确率; 最后通过比较每个模板第一、第二、第三组的碱基片段信息,并结合测序的顺序来解码 两组或两组以上的编码信息,组装出待测核酸片段的具体碱基序列。

具体实施方式

以下结合实施例对本发明作进一步的详细说明。

实施例1:炎黄一号基因组的特殊修饰的核苷酸编码测序

1、全基因组模板制备:利用超声波方法将目的基因组打碎成100-500bp的碱基片段, 在连接酶的作用下将DNA片段两端加上一对序列已经知道的通用连接子P1、P2;然后凝 胶电泳切割180-220bp DNA片段并纯化,并进行8个循环的预扩增;然后将这些预扩增好 的DNA片段与固定有其中一个连接子互补序列的磁珠进行乳液PCR反应,得到大量长有 目的基因组DNA片段的单克隆磁珠,并变性得到基因组测序模板,最后将这些扩增有片 段化DNA模板的磁珠固定在微流控芯片上。

2、测序引物杂交:将单克隆磁珠上的模板链与能和3’端连接子互补的引物杂交,杂 交引物作为模板DNA的测序引物(为了保证每个模板均能发生合成反应,我们将测定连 接子上的一个已知碱基序列,并在每组测序反应中的第一个二核苷酸测序反应中包含其 互补碱基,如连接子已知碱基为A,每组测序反应中的第一次二核苷酸测序反应中均包 含标记的dUTP-diol-NH2)。

3、将Cy3-dNTPs-diol-NH2和Cy5-dNTPs-diol-NH2按照表2的方式进行两种核苷酸同时合 成循环测序:

表2

1)、在第一组测序反应中,首先按照Cy3-dUTP-diol-NH2/dTTP=50:1(1μM∶0.02μM)、 Cy5-dCTP-diol-NH2/dCTP=50:1(1μmM∶0.02μmM)的摩尔比例将两种核苷酸加入,在 0.2U/μl9°N DNA聚合酶的作用下反应5分钟,然后用含0.01%wt Trion X-100、20%wt甘 油的缓冲液1洗涤,最后用CCD成相,得到此次测序反应的荧光种类和强度信息的编码(其 中Cy3表示碱基T、Cy5表示碱基C,而荧光强度最后通过比较相同模板上不同次数的测 序强度最后转化为碱基个数)。

2)用50mM的高碘酸钠室温处理5分钟,氧化邻二醇羟基,使得邻碳的单键断开, 清除荧光基团;

3)按照Cy3-dGTP-diol-NH2/dGTP=50:1(1μM∶0.02μM)、Cy5-dATP-diol-NH2/dATP =50:1(1μM∶0.02μM)的摩尔比例将四种核苷酸加入,在0.2U/μl9°N DNA聚合酶作用 下反应5分钟,然后用含0.01%wt Trion X-100、20%wt甘油的缓冲液1洗涤,最后用CCD 成相,得到该次测序反应的荧光种类和强度信息(其中Cy3表示碱基G、Cy5表示碱基A, 而荧光强度最后通过比较相同模板上不同次数的测序强度最后转化为碱基个数,例如: 分析得出一个碱基的基准荧光强度为8000,两个碱基的基准荧光强度为12000,根据荧 光强度值得出碱基的个数);

4)用50mM的高碘酸钠室温处理5分钟,氧化邻二醇羟基,使得邻碳的单键断开, 清除荧光基团;

5)循环步骤1)~4)若干次,如进行40次两核苷酸同时合成循环测序,则至少可 得到40个核酸片段相应编码构成的序列信息。

6)用含0.005M NaOH和65%wt甲酰胺的缓冲液2在65℃下处理10分钟,将第一组 测序反应中的测序引物、及其测序引物合成链清除,重新得到单链DNA模板;

7)然后更换核苷酸的组合,按照上述1)-5)的步骤将第二组核苷酸循环测序,得 到第二组核酸片段编码构成的序列信息;

8)按照编码对应核酸片段的方式,分别将每个模板第一、第二组核苷酸循环测序 的编码信息转化为碱基片段信息;

9)通过比较每个模板第一、第二组的碱基片段信息,并结合测序的顺序,将每个 模板第一、第二组的碱基片段信息组装出待测核酸序列的具体碱基信息。

将所有模板的碱基序列信息,分别组装成炎黄一号基因组序列。

实施例2:酿酒酵母基因组的特殊修饰的核苷酸编码测序

1、全基因组模板制备:利用超声波方法将酿酒酵母基因组打碎成100-500bp的碱基 片段,在连接酶的作用下将DNA片段两端加上一对序列已经知道的通用连接子P1、P2; 然后凝胶电泳切割180-220bp DNA片段并纯化,并进行8个循环的预扩增;然后将这些预 扩增好的DNA片段与固定有其中一个连接子互补序列的磁珠进行乳液PCR反应,得到大 量长有目的基因组DNA片段的单克隆磁珠,并变性得到基因组测序模板,最后将这些扩 增有片段化DNA模板的磁珠固定在微流控芯片上。

2、测序引物杂交:将单克隆磁珠上的模板链与能和3’端连接子互补的引物杂交,杂 交引物作为模板DNA的测序引物(为了保证每个模板均能发生合成反应,我们将测定连 接子上的一个已知碱基序列,并在每组测序反应中的第一个二核苷酸测序反应中包含其 互补碱基,如连接子已知碱基为A,每组测序反应中的第一次二核苷酸测序反应中均包 含标记的dUTP-diol-NH2)。

3、将Cy3-dNTPs-diol-NH2和Cy5-dNTPs-diol-NH2按照表3的方式进行两种核苷酸同时 合成循环测序:

表3

1)、在第一组测序反应中,首先按照Cy3-dUTP-diol-NH2/dTTP=50:1(1μM∶0.02μM)、 Cy5-dCTP-diol-NH2/dCTP=50:1(1μmM∶0.02μmM)的摩尔比例将两种核苷酸加入,在 0.2U/μl9°N DNA聚合酶的作用下反应5分钟,然后用含0.01%wt Trion X-100、20%wt甘 油的缓冲液1洗涤,最后用CCD成相,得到此次测序反应的荧光种类和强度信息的编码(其 中Cy3表示碱基T、Cy5表示碱基C,而荧光强度最后通过比较相同模板上不同次数的测 序强度最后转化为碱基个数,例如:分析得出一个碱基的基准荧光强度为8000,两个碱 基的基准荧光强度为12000,根据荧光强度值得出碱基的个数)。

2)用50mM的高锰酸钾室温处理5分钟,氧化邻二醇羟基,使得邻碳的单键断开, 清除荧光基团;

3)按照Cy3-dGTP-diol-NH2/dGTP=50:1(1μM∶0.02μM)、Cy5-dATP-diol-NH2/dATP =50:1(1μM∶0.02μM)的摩尔比例将四种核苷酸加入,在0.2U/μl9°N DNA聚合酶作用 下反应5分钟,然后用含0.01%wt Trion X-100、20%wt甘油的缓冲液1洗涤,最后用CCD 成相,得到该次测序反应的荧光种类和强度信息(其中Cy3表示碱基G、Cy5表示碱基A, 而荧光强度最后通过比较相同模板上不同次数的测序强度最后转化为碱基个数);

4)用50mM的高锰酸钾室温处理5分钟,氧化邻二醇羟基,使得邻碳的单键断开, 清除荧光基团;

5)循环步骤1)~4)若干次,如进行40次两核苷酸同时合成循环测序,则至少可 得到40个核酸片段相应编码构成的序列信息。

6)用含0.005M NaOH和65%wt甲酰胺的缓冲液2在65℃下处理10分钟,将第一组 测序反应中的测序引物、及其测序引物合成链清除,重新得到单链DNA模板;

7)然后更换核苷酸的组合,按照上述1)-5)的步骤将第二组核苷酸循环测序,得 到第二组核酸片段编码构成的序列信息,为了提高测序准确率,按照上述方法进行第三 组的核苷酸循环测序;

8)按照编码对应核酸片段的方式,分别将每个模板第一、第二、第三组核苷酸循 环测序的编码信息转化为碱基片段信息;

9)通过比较每个模板第一、第二、第三组的碱基片段信息,并结合测序的顺序, 将每个模板第一、第二、第三组的碱基片段信息组装出待测核酸序列的具体碱基信息。

将所有模板的碱基序列信息,分别组装成酿酒酵母基因组序列。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号