首页> 中国专利> 测序文库接头、测序文库及其构建方法、提升NGS建库连接效率的方法

测序文库接头、测序文库及其构建方法、提升NGS建库连接效率的方法

摘要

本发明提供一种测序文库接头、测序文库及其构建方法、提升NGS建库连接效率的方法。其中,该测序文库接头的3’末端为TG(T/A)。应用本发明的技术方案,通过将测序文库接头以TG末尾来提高连接效率,进一步的,以ATG结尾末端进一步提高连接效率,以此提升测序文库的建库效率。

著录项

  • 公开/公告号CN114807125A

    专利类型发明专利

  • 公开/公告日2022-07-29

    原文格式PDF

  • 申请/专利权人 纳昂达(南京)生物科技有限公司;

    申请/专利号CN202210550745.X

  • 发明设计人 胡玉刚;汪彪;曲燕;吴强;

    申请日2022-05-20

  • 分类号C12N15/11;C12Q1/6806;C12Q1/6869;C40B50/06;C40B40/06;

  • 代理机构北京康信知识产权代理有限责任公司;

  • 代理人金田蕴

  • 地址 210000 江苏省南京市江北新区华康路142号南京生物医药谷加速器三期A01栋南侧3-4层

  • 入库时间 2023-06-19 16:09:34

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-29

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及测序文库构建技术领域,具体而言,涉及一种测序文库接头、测序文库及其构建方法、提升NGS建库连接效率的方法。

背景技术

高通量测序作为重要的临床准确诊断获取信息的手段,科研人员和临床医生越来越重视NGS在临床诊断中的应用。目前,在肿瘤的靶向治疗方面,由于大量的FFPE样本有不同程度的降解,在肿瘤早筛和无创产前检测过程中,需要用cf/ctDNA样本进行建库,如何提升建库效率,充分利用有限的信息是人们探索的一致方向。在以往的探索过程中,有优化建库连接效率的酶和缓冲液、单链建库(US9896709)和平端腺苷化连接的(US20190010540A1)。虽然单链建库和平端腺苷化连接能够提升连接效率,但是由于这些建库流程过程过长和操作复杂,在做复杂样本时并不一定表现出优势。在基于A-T连接的优化酶和缓冲液的提升方面几乎已经到了尽头,因为加A效率限制、5’端碱基的无法修复和磷酸化限制导致这种提升。

由于目前大部分测序平台的建库接头都是基于A-T连接实现,并且固定接头末端,由于测序引物也是配套固定的序列,在改进加A效率不完全时的其它补救措施都不能实现提升连接效率。

因此,亟待开发新的方法进一步提升建库效率。

发明内容

本发明旨在提供一种测序文库接头、测序文库及其构建方法、提升NGS建库连接效率的方法,以提升建库效率。

为了实现上述目的,根据本发明的一个方面,提供了一种测序文库接头。该测序文库接头的3’末端为TG(T/A)。

进一步地,测序文库接头的3’末端为ATG(T/A)。

进一步地,测序文库接头的末端T碱基3’端的-OH上的O用S修饰。

进一步地,测序文库接头为双端测序文库接头或单端测序文库接头。

进一步地,测序文库接头为在MGI或Illumina测序平台的测序文库接头序列基础上改变末端碱基获得。

进一步地,测序文库接头从5’端到3’端包括测序引物结合区和分子标签,部分分子标签的T改为C;优选的,10%的分子标签末端的T改为C;优选的,测序引物结合区的3’端增加碱基C;优选的,测序文库接头具有如SEQ ID NO:1和SEQ ID NO:2所示的序列;或如SEQID NO:3和SEQ ID NO:4所示的序列。

根据本发明的另一方面,提供了一种测序文库构建试剂盒。该测序文库构建试剂盒包括上述任一种测序文库接头。

根据本发明的再一方面,提供了一种测序文库的构建方法。该构建方法包括将上述任一种测序文库接头连接到待测序的目的片段上。

根据本发明的又一方面,提供了一种测序文库。该测序文库为通过上述任一种测序文库的构建方法构建而成。

进一步地,测序文库为用于MGI和Illumina测序平台的测序文库。

根据本发明的再一方面,提供了一种提升NGS建库连接效率的方法。该方法包括:将测序文库接头的3’末端设计为TG,以及将测序文库接头与待测目的片段通过T/A连接。

进一步地,将测序文库接头的3’末端设计为ATG;优选的,测序文库接头的末端T碱基3’端的-OH上的O用S修饰;优选的,测序文库接头为双端测序文库接头或单端测序文库接头;优选的,测序文库接头为在MGI或Illumina测序平台的测序文库接头序列基础上改变末端碱基获得;优选的,测序文库接头从5’端到3’端包括测序引物结合区和分子标签,部分分子标签接头末端的T改为C;更优选的,10%~20%的分子标签末端的T改为C;进一步优选的,测序文库接头具有如SEQ ID NO:1和SEQ ID NO:2所示的序列;或如SEQ ID NO:3和SEQID NO:4所示的序列。

应用本发明的技术方案,通过将测序文库接头以TG末尾来提高连接效率,进一步的,以ATG结尾末端进一步提高连接效率,以此提升测序文库的建库效率。

附图说明

构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1示出了目前MGI和Illumina测序平台接头末端三碱基;

图2示出了MGI不同末尾两碱基的连接效率;

图3示出了Illumina不同末尾两碱基的连接效率;

图4示出了MGI末尾两碱基16种组合的连接效率排名;

图5示出了Illumina末尾两碱基8种组合的连接效率排名;

图6示出了在双测序平台上末端连接效率最高的末端4碱基组成;

图7示出了在双测序平台上末端连接效率最高的末端3碱基组成和目前各自的末尾三碱基;

图8示出了不同接头末端连接效率对比;

图9示出了接头末端和测序引物之间的关系;

图10示出了接头末端分子标签和测序引物之间的关系;

图11示出了接头末端分子标签末端加C可以提升连接效率。

具体实施方式

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

术语解释:

分子标签接头:在需要标定模板的高通量测试时接的测序接头,与普通接头的区别是在普通接头末端添加一段3-5个碱基的随机序列。

测序引物结合区:在高通量测序的过程中,测序引物结合在接头的区域,一般这个区域会把通用的接头区域覆盖,读取的碱基就是插入片段部分。

建库接头:在MGI和Illumina测序平台都各自有自己的一套建库系统,建库包含建库试剂盒和接头部分,一般建库试剂盒是可以通用,建库接头不能通用,或不完全一致。

目前,MGI和Illumina测序平台分别有各自的建库接头,目前主流的建库系统还是通过T-A连接的方式实现,虽然Swift公司推出了单链建库和IDT公司的依赖腺苷化的平连实现了高效的连接,但是由于这些建库过程相对复杂,并不是目前建库的主流。在T-A建库连接的过程中,最开始修复和补平是一个步骤,加A是另一步完成,目前经过优化已经融合了修复补平加A在单管中通过控制不同的反应温度实现,并且修复补平加A的反应液不需要回收直接进行连接反应,在系列的优化过程中对酶的种类和用量及反应buffer的组成都进行了系统的优化。由于在T-A连接过程中依赖加A的效率和目标片段5’的磷酸化状态,加A的效率由于受到Taq酶的作用不只加A,还有部分加G碱基,同时5’端碱基如果有损伤是不能够被修复的,所以这些都限制了高效连接。

除了上述原因,还有受每种建库平台的接头末端序列决定,如图1所示,在MGI和Illumina的平台各自的接头末端三个碱基均不相同,MGI接头末端三个碱基是ACT,Illumina接头末端三个碱基是ATC,虽然这些接头都是经过优化,但是本发明的发明人在测试分子标签接头时,这两个平台目前选择的末端并不是最优选择。发明人在评估MGI平台分子标签接头的末端两个碱基的16种组合与目标片段的末端两碱基的16种组合的统计发现,不同的末端是有不用的连接效率,如图2所示,两碱基的16种组合在连接目标片段时差异明显;这种现象同样在Illumina测序平台也发现相似规律,虽然在Illumina测序平台的接头末端两个碱基种类只有8组,规律是一样的,如图3所示,在两个平台都是TG结尾的连接效率最高。在MGI测序平台的分子标签16种组合二碱基末端的均值排名如图4所示,TG是排名第一,MGI测序平台的接头相同末端两碱基是排名第4位,Illumina测序接头的相同末端两碱基是排名第6位。在Illumina测序平台的分子标签统计二碱基末端虽然不是16种组合都有,只有8种组合,也能反馈出基本问题,TG末尾的依然排名第一,Illumina相同结尾的排在第四名,如图5所示。从两个测序平台的分子标签末尾碱基连接通知看说明两个问题:第一个是连接效率受末端碱基的影响;第二点目前两个测序平台的接头末端效率排在中游以上,并不是连接效率最高的组合。

在研究MGI和Illumina双平台的分子标签接头除了统计前两个碱基外,还分析了第三个碱基的倾向性,虽然在倒数三位有四种组合形式,可以是A,T,G和C个任意一个碱基,比较统一的是在双侧序平台最高的分子标签组合都是ATG组合,说明在T-A连接的体系中,末端碱基的都能连接,但是每种组合的连接效率是有差异的,要想达到更好的效果,除了优化建库的酶和缓冲液体系,同时也要选择合适的接头末端碱基组合,如图6所示,如果MGI和Illumina测序平台的接头末端如果是ATG结尾会提升连接效率。

为了证明在分子标签中测试的规律是否在单端接头中是否是ATG结尾的接头在只有一种接头时具有连接效率优势,发明人分别对比了在MGI和Illumina平台末尾三个碱基的连接情况,把MGI原来末尾的ACT改为ATG,Illumina的原来ATC的改为ATG,如图7所示。同时也分别测试了建库的文库产量,ATG结尾的比原来的平台接头末端文库产量提升10-20%之间,所图8所示的文库产量结果,这充分说明在分子标签中测试了连接末端影响连接效率,在单独一种序列存在时也同样表现出来ATG末尾的接头有连接优势。

在测试分子标签接头时,由于分子标签接头加在通用接头前面,所以分子标签接头是可以不以T结尾的接头,原因是在普通的接头是完全和测序引物重合的,如果在普通接头末端突出碱基T改为C来弥补末端不完全加A,部分加G碱基,这样会影响测序引物的结合会影响测序的正常读取,如图9所示,如果在接头末端加C,虽然可以建库和读取,但是由于第一位读取的是C碱基,这个碱基是加上去的,会影响测序质量和是否去掉这个碱基的矛盾中。在分子标签接头的应用过程中,这个问题就不存在了,由于分子标签接头在固定接头末端一般加3-5个N碱基,一方面是碱基平衡性有保证,另一方面是在分子标签接头的应用过程中,分子标签的主要目的是标记序列,分析完是把标签去除进行数据分析的,所以既不影响测序,也不影响数据的平衡性,同时把部分分子标签接头的末端的T改为C可以提升连接效率,提升文库的转化效率,可以很好的利用有限的cf/ctDNA样本检测更低频的突变,如图10所示,在本发明测试中把一部的分子标签接头的末端设计为T结尾,另一部分分子标签接头的末端设计为C结尾。为了验证这种方案是否能够提升连接效率,本研究在64组分子标签测序结果靠后的5名分子标签除了以T结尾还添加了以C结尾的分子标签接头,经过建库测试发现在加有C碱基的结尾的分子标签排名大幅提前,如图11所示,排名上升四十多位,测序数据加C末尾的比没有加C的数据量提升了1倍多,这充分说明,在分子标签的应用中,除了T碱基结果还可以加部分C碱基结尾,这样能够提升连接效率。

综上所述,发明人在测试分子标签时发现,由于分子标签末端有各种序列组成的末端,连接效率会因为不同的末端有明显的差异,差距最大会有5-6倍。同时因为分子标签接头是在测序引物的外侧,是可以弥补加A方面的缺陷,突出末端是可以改变碱基提升连接效率。具体的,本发明通过在MGI和illumina两种测序平台的分子标签接头测试发现,不同的接头末端影响连接效率,目前MGI和Illumina的接头并不是最佳连接末端。本发明发现在T-A连接的过程中,末尾碱基是ATG有利于T-A连接达到最佳效果;在分子标签建库过程中突出末端除了T外,补充部分C突出末端有利于高效连接建库。

基于上述发现,根据本发明一种典型的实施方式,提供一种测序文库接头。该测序文库接头的3’末端为TG(T/A),其中,(T/A)表示此文库接头后面是T/A连接;优选的,测序文库接头的3’末端为ATG(T/A)。其中,“/”代表“或”。

在一种典型的实施方式中,测序文库接头的末端T碱基3’端的-OH上的O用S修饰,可以阻止引物被降解。本发明中的测序文库接头适应于双端测序,也是应用单端测序。为了使用方便及能够被广泛的应用,典型的,本发明的测序文库接头为在MGI或Illumina测序平台的测序文库接头序列基础上改变末端碱基获得。优选的,测序文库接头具有如SEQ IDNO:1和SEQ ID NO:2所示的序列;或如SEQ ID NO:3和SEQ ID NO:4所示的序列。

根据本发明一种典型的实施方式,提供一种测序文库构建试剂盒。该测序文库构建试剂盒上述任一种测序文库接头,进一步为了方便使用,测序文库构建试剂盒还可以包括其用于测序文库构建的试剂。

根据本发明一种典型的实施方式,提供一种测序文库的构建方法。该构建方法包括将测序文库接头连接到待测序的目的片段上,具体操作可参见本申请的实施方式及实施例部分。通过该方法构建的测序文库,能够充分利用有限的目的片段,达到高效建库,并且得到更准确的测序结果的目的,优选的,测序文库为用于MGI和Illumina测序平台的测序文库。

下面将结合具体的实施例来进一步说明本申请的有益效果。

实施例1

步骤一:用天根血清/血浆游离DNA提取试剂盒(离心柱型)(DP339)提取人血浆DNA,建库投入10ng血浆碎片DNA。

步骤二:末端修复&加A

1、取出End Repair&A-Tailing Buffer和End Repair&A-Tailing Enzyme置于冰上自然融解,混合均匀,瞬时离心备用。

2、按照下表1,在置于冰上的0.2ml PCR管中进行反应体系配制:

表1

3、混合均匀,瞬时离心使全部反应液置于PCR管底部。

4、在PCR仪上启动如下表2所示的反应程序,等温度稳定至20℃时将反应管放进PCR仪:

表2

步骤三:接头连接

1、取出Ligation Buffer和DNA Ligase置于冰上自然融解,混合均匀,瞬时离心备用。

2、从PCR仪上取出步骤二PCR反应管,置于冰上,按照表3所示的体系进行接头连接反。

表3:应体系配制:

3、混合均匀,瞬时离心使全部反应液置于PCR管底部。

4、在PCR仪上启动如下表4的反应程序,等温度稳定至20℃时将反应管放进PCR仪:

表4

步骤四:磁珠纯化

1、提前将NanoPrep

2、向步骤三连接体系PCR管加入40μl NanoPrep

3、将PCR管瞬时离心后放置于磁力架上5min至液体完全澄清,使用移液器吸取移弃上清。

4、沿PCR管侧壁缓慢加入150μl 80%乙醇,注意勿扰动磁珠,静置30s,使用移液器吸取移弃上清。

5、重复步骤4一次。

6、将PCR管瞬时离心后放置于磁力架上,使用10μl吸头移去少量残留乙醇,注意勿吸到磁珠。

7、打开PCR管管盖,并于室温静置约5min,至乙醇挥发完全。

8、移出PCR管,向PCR管中加入21μl Nuclease Free Water,将磁珠悬浮均匀,25℃孵育2min。

9、将PCR管瞬时离心后放置于磁力架上2min至液体完全澄清,使用移液器吸取20μl上清,并转移至1个新的0.2ml PCR管中,置于冰上备用。

步骤五:PCR扩增

1、取出2X HiFi PCR Master Mix和Amplification Primer Mix置于冰上自然解冻,混合均匀,瞬时离心备用。

2、按照表5中所示的体系在置于冰上的PCR管中进行反应体系配制:

表5

3、将PCR管放入PCR仪中启动表6中的程序:

表6

步骤五:文库纯化、定量和质检

1、向PCR管加入60μl的NanoPrep

2、将PCR管瞬时离心后放置于磁力架上5min,至液体完全澄清,使用移液器吸取移弃上清。

3、沿PCR管侧壁缓慢加入150μl 80%乙醇,注意勿扰动磁珠,静置30s,使用移液器吸取移弃上清。

4、重复步骤3一次。

5、PCR管瞬时离心,放置于磁力架上,使用10μl吸头移去少量残留乙醇,注意勿吸到磁珠。

6、打开PCR管管盖,并于室温静置约5min,至乙醇挥发完全。

7、向PCR管加入20μl TE Solution,使用移液器将磁珠悬浮均匀,25℃孵育2min。

8、将PCR管瞬时离心后放置于磁力架上2min,至液体完全澄清,使用移液器小心将上清移取至一个新的0.2ml PCR管中进行保存,注意勿吸到磁珠。

9、使用Qubit对文库进行定量。

10、使用Bioanalyzer(Agilent)、Qsep100(Bioptic)等相关片段分析仪器进行文库片段分布检测。

步骤六:上机测序和数据分析

1、用MGI-2000测序仪测定PE150。

2、分析时用前三个碱基的分子标签进行统计分析,比对时去掉前7个碱基。

其中,本实施例中测试的MGI UMI Adapter中末端标签序列信息如下表(MGI UMIAdapter结构具体参见CN109971827A):

表7

实施例1的测试结果:在MGI平台分子标签接头的末端两个碱基的16种组合与目标片段的末端两碱基的16种组合的统计发现,不同的末端是有不用的连接效率,如图2所示,两碱基的16种组合在连接目标片段时差异明显。在MGI分子标签的建库接头是由64种混合组成,在评估末尾两个碱基是有16种组合。

实施例2

实施例2和实施例1的区别在于:实施例2用的接头是针对Illumina测序平台的分子标签,扩增引物是针对Illumina平台的双端index引物,其它操作流程完全一样。

针对Illumina测序平台的分子标签信息如下:

表8

*号表示硫代修饰,将T碱基3’端的-OH上的O用S修饰,以防止接头被内切酶切掉。

实施例的测试结果:在MGI测序平台的这种现象同样在Illumina测序平台也发现相似规律,虽然在Illumina测序平台的接头末端两个碱基种类只有8组,规律是一样的,如图3所示,在两个平台都是TG结尾的连接效率最高。在Illumina的分子标签接头的设计过程中,由于末尾选择了G或C结尾,所在评估末尾两个碱基的组合时只有8种组合,这并不影响本发明的情况评估。

实施例3

用ATG结尾的通用接头建库评估接头末端碱基对建库效率的影响

实施例3用

MGI ATG结尾接头1,SEQ ID NO:1

/phos/CATCGGAGGCCAAGCGGTCTTAGGAAGACAATCAG,/phos/代表磷酸化。

MGI ATG结尾接头2,SEQ ID NO:2

CTGATTGTCTTCCTAAGCACAGAACGACATGGCTACGATCCGATG*T,其中*代表T碱基3’端的-OH上的O用S修饰。

Illumina ATG结尾接头1,SEQ ID NO:3

/5Phos/CATCGGAAGAGCACACGTCTGAACTCCAGTCAC,/phos/代表磷酸化。

Illumina ATG结尾接头2,SEQ ID NO:4

ACACTCTTTCCCTACACGACGCTCTTCCGATG*T,其中*代表T碱基3’端的-OH上的O用S修饰。

经过对比建库测试发现,以ATG三碱基结尾的建库接头封闭替换MGI和Illumian原始接头末端三个碱基对比建库实验,发现以ATG结尾的末端比目前测序平台原始的接头末端连接效率高10-20%,如图8所示。

实施例4

为了提升连接效率在分子标签接头建库时增加了部分GC连接接头。

本实施例和实施例1的流程一致,在分子标签接头部分,把连接效率靠后的5个分子标签接头的接头末尾由T改为C。在普通建库接头中由于接头和测序引物部分重叠,所以接头部分不能随意改动,改动后即使建库效率高,改动的建库产物也不能在后续的测序过程中有体现,如图9所示。在分子标签接头建库不存在这个问题,由于分子标签已经在测序引物结合的外部,所以是可以增加由于末端不止加A的末端的连接效率提升,在建库片段有一部分是加G结尾,这样本发明把连接效率靠后的接头补充了以C结尾的末端(大约10%),进而提升了建库的连接效率。图11所示,在靠后的5个分子标签加入C碱基后,连接数据有1倍多的提升,同时也不影响测序过程中的读取。如图10所示,测序引物结合的是通用接头部分,分子标签和建库连接时用到的A和C都在测序引物读取序列里,不在引物结合区,这样既可以提升连接效率,有不影响测序,是一种比较好的改进措施。

综上所述,本发明针对MGI和Illumina各自测序平台的建库接头末端序列连接效率的评估,尤其是分子标签建库的评估,在评估的过程中发现,建库接头末端的两个碱基和三个碱基是决定连接效率的主要因素,不同的末端连接效率最高有5-6倍的差异,在双测序平台都发现以TG末尾两碱基结尾是连接效率最高的组合,如果在考虑第三个碱基就是ATG结尾末端连接效率最高。同时在测试分标签接头时由于测序因为在分子标签接头结合位点不重合,可以部分接头采用C结尾的CG连接来提升建库效率。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

序列表

<110> 纳昂达(南京)生物科技有限公司

<120> 测序文库接头、测序文库及其构建方法、提升NGS建库连接效率的方法

<130> PN181314NAGD

<160> 4

<170> SIPOSequenceListing 1.0

<210> 1

<211> 35

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> primer_bind

<222> (1)..(1)

<223> 5'端进行磷酸化修饰

<400> 1

catcggaggc caagcggtct taggaagaca atcag 35

<210> 2

<211> 46

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> primer_bind

<222> (45)..(46)

<223> T碱基3’端的-OH上的O用S修饰

<400> 2

ctgattgtct tcctaagcac agaacgacat ggctacgatc cgatgt 46

<210> 3

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> primer_bind

<222> (1)..(1)

<223> 5'端进行磷酸化修饰

<400> 3

catcggaaga gcacacgtct gaactccagt cac 33

<210> 4

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> primer_bind

<222> (32)..(33)

<223> T碱基3’端的-OH上的O用S修饰

<400> 4

acactctttc cctacacgac gctcttccga tgt 33

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号