首页> 中国专利> 使用大规模平行测序对LNA寡核苷酸治疗药物进行质量控制

使用大规模平行测序对LNA寡核苷酸治疗药物进行质量控制

摘要

本发明涉及治疗性寡核苷酸分析领域,并提供用于治疗性寡核苷酸的基于引物的平行测序的方法,所述方法提供基于序列的质量信息,所述质量信息可与目前的色谱法或质谱法结合使用或代替其使用,并可用于例如寡核苷酸治疗的发现、制造、质量保证、治疗性开发和患者监测。

著录项

说明书

技术领域

本发明涉及治疗性寡核苷酸分析领域,并提供用于治疗性寡核苷酸的基于引物的平行测序的方法,其提供基于序列的质量信息,其可与目前的色谱法或质谱法结合使用或代替色谱法或质谱法使用,并可用于例如寡核苷酸治疗的发现、制造、质量保证、治疗性开发和患者监测。

背景技术

用于确定治疗性寡核苷酸制造质量的分析工具通常使用基于色谱分离和质谱(MS)的分析工具。复杂的质谱需要一定程度的解释,因此无法明确地确定寡核苷酸群体中的序列分布。因此,MS工具在寡核苷酸制备中鉴定和/或定量基于序列的错误的能力受到限制,这些错误可能例如由于输入错误、不完全偶联、双重偶联或通过亚磷酰胺杂质而引入。

因此,需要用于治疗性寡核苷酸制造中的质量保证的改进方法。

EP 1 914 317 A1公开了一种用于定性和定量检测长度为约8至50个核苷酸的短核酸序列的方法。该方法采用重叠捕获探针和聚合酶延伸的杂交。EP'317的实例使用DNA硫代磷酸酯寡核苷酸G3139。

WO 01/34845 A1公开了一种用于从体液或提取物中定量硫代磷酸酯寡核苷酸的方法。该方法采用与寡核苷酸部分杂交的捕获探针,然后对捕获探针/寡核苷酸杂交体进行酶标记,然后检测标记。WO'845的实例使用DNA硫代磷酸酯寡核苷酸ISIS 2302。

Caifu等人,NAR 33(2005)E179公开了使用基于捕获探针/PCR的扩增系统检测和定量未修饰的短寡核苷酸,诸如microRNA。

Froim等人,VAR(1995)4219-4223公开了用于通过具有UV检测的毛细管电泳进行硫代磷酸酯反义DNA测序的方法。

Tremblay等人,Bioanalysis(2011)3(5)公开了一种基于双连接的杂交测定,用于特异性测定寡核苷酸治疗药物,并用于特异性测定实施定量PCR的复杂混合物中的单个代谢物。

WO2007/025281公开了一种用于使用捕获探针杂交、连接和扩增来检测短寡核苷酸的方法。

Cheng等人,Molecular Therapey Nucleic Acids(2013)e67公开了用于鉴定脑穿透适体的体内指数富集的配基系统进化技术(selex)。适体是2'氟修饰的磷酸二酯寡核苷酸,使用OneStep RT-PCR试剂盒(Qiagen)或Superscript III逆转录酶进行第一链合成,通过Sanger测序或Illumina测序进行测序。

Crouzier等人,PLoS ONE(2012)e359900涉及使用Superscript III有效逆转录锁定的核酸核苷酸,以产生抗核酸酶的RNA适体。Crouzier等人使用基于Sanger的测序对从LNA适体寡核苷酸的第一链合成获得的PCR扩增产物进行测序。值得注意的是,LNA适体在另外的RNA磷酸二酯核苷背景中具有单个LNA核苷。

本发明人已经提供3'捕获探针连接和基于聚合酶的修饰的寡核苷酸(诸如2'-O-MOE和LNA修饰的寡核苷酸)的检测,其能够对此类修饰的寡核苷酸进行大规模平行测序。PCT/EP2017/078695公开了一种用于对核苷修饰的寡核苷酸(诸如LNA修饰的寡核苷酸)进行检测、定量、扩增、测序或克隆的方法,该方法基于使用捕获探针对修饰的寡核苷酸进行3'捕获然后对核苷修饰的寡核苷酸进行链延伸和检测、定量、扩增、测序或克隆。PCT/EP2017/078695公开了Volcano2G聚合酶作为合适的酶用于链延伸的用途。

发明内容

本发明提供了一种用于对修饰的寡核苷酸的核碱基序列进行测序的方法,所述方法包括以下步骤:

a.将捕获探针寡核苷酸连接至修饰的寡核苷酸的3'末端;

b.从捕获探针进行聚合酶介导的5'-3'第一链合成,以产生包含修饰的寡核苷酸的互补序列的核酸序列;

c.将衔接子探针连接至步骤b中获得的第一链合成产物的3'端;以及随后

-对步骤c)中获得的连接产物进行基于引物的测序;或者

-对步骤c)中获得的连接产物进行PCR扩增,并对PCR扩增产物进行基于引物的测序。

本发明提供了一种用于对修饰的寡核苷酸群体的碱基序列进行平行测序的方法,所述方法包括以下步骤:

a.将捕获探针寡核苷酸连接至修饰的寡核苷酸群体中存在的修饰的寡核苷酸的3'末端;

b.从捕获探针进行聚合酶介导的5'-3'第一链合成,以产生核酸序列群体,每个核酸序列都包含修饰的寡核苷酸群体中存在的修饰的寡核苷酸的碱基序列的互补序列;

c.将衔接子探针连接至步骤b中获得的第一链合成产物的3'端;以及随后

-对步骤c)中获得的连接产物执行基于引物的平行测序;或者

-对步骤c)中获得的连接产物进行PCR扩增,并对PCR扩增产物进行基于引物的平行测序。

在一些实施例中,修饰的寡核苷酸是2'糖修饰的寡核苷酸,诸如LNA寡核苷酸或2'-O-甲氧基乙基(MOE)寡核苷酸。

在一些实施例中,修饰的寡核苷酸是2'糖修饰的硫代磷酸酯寡核苷酸,诸如LNA寡核苷酸硫代磷酸酯或2'-O-甲氧基乙基硫代磷酸酯(MOE)寡核苷酸。

本发明提供了一种用于确定来自共同的寡核苷酸合成轮次或一组独立的寡核苷酸合成轮次的修饰的寡核苷酸群体中序列异质性的方法,所述方法包括以下步骤:

(i)获得或合成修饰的寡核苷酸,

(ii)执行根据本发明的用于对修饰的寡核苷酸进行平行测序的方法,

(iii)分析在步骤(ii)中获得的序列数据,以鉴定修饰的寡核苷酸群体的序列异质性。

本发明提供了一种用于验证修饰的寡核苷酸的序列的方法,所述方法包括以下步骤:

(i)获得或合成修饰的寡核苷酸

(ii)执行根据本发明的用于对修饰的寡核苷酸进行平行测序的方法,

(iii)分析获得的序列数据,以验证修饰的寡核苷酸的序列

本发明提供了一种用于确定修饰的寡核苷酸的纯度的方法

(i)获得或合成修饰的寡核苷酸

(ii)执行根据本发明的用于对修饰的寡核苷酸进行平行测序的方法,

(iii)分析获得的序列数据,以确定修饰的寡核苷酸的纯度。

本发明提供了平行测序的用途,诸如大规模平行测序用于对修饰的寡核苷酸群体的核碱基序列进行测序的用途。

本发明提供了边合成边测序测序用于对修饰的寡核苷酸的核碱基序列进行测序的用途。

本发明提供了边合成边测序测序用于对平行修饰的寡核苷酸群体的核碱基序列进行测序的用途。

本发明提供了边合成边测序测序用于确定修饰的寡核苷酸诸如治疗性寡核苷酸的合成或制造轮次的产物的质量的用途。

本发明提供了边合成边测序测序用于确定修饰的寡核苷酸诸如治疗性寡核苷酸的合成或制造轮次的产物的序列的异质性和每个独特序列的出现的用途。

本发明提供了边合成边测序测序用于确定修饰的寡核苷酸诸如治疗性寡核苷酸的合成或制造轮次的产物的质量的用途。

本发明提供了边合成边测序测序用于确定修饰的寡核苷酸诸如治疗性寡核苷酸的合成或制造轮次的产物的异质性的用途。

本发明提供了基于引物的测序用于确定修饰的寡核苷酸诸如治疗性寡核苷酸的合成或制造轮次的产物的质量的用途。

本发明提供了基于引物的测序用于确定修饰的寡核苷酸诸如治疗性寡核苷酸的合成或制造轮次的产物的序列的异质性和每个独特序列的出现的用途。

本发明提供了诸如大规模平行测序的平行测序用于确定修饰的寡核苷酸诸如治疗性寡核苷酸的合成或制造轮次的产物的质量的用途。

本发明提供了诸如大规模平行测序的平行测序用于确定修饰的寡核苷酸诸如治疗性寡核苷酸的合成或制造轮次的产物的质量的用途。

本发明提供了Taq聚合酶,诸如SEQ ID NO 1或与SEQ ID NO 1具有至少70%同一性的DNA聚合酶诸如Volcano2G聚合酶的用途,用于从包含LNA修饰的硫代磷酸酯寡核苷酸或2'-O-甲氧基乙基修饰的硫代磷酸酯寡核苷酸的模板进行第一链合成。

在一些实施例中,修饰的寡核苷酸是LNA修饰的寡核苷酸,诸如LNA硫代磷酸酯寡核苷酸。在一些实施例中,修饰的寡核苷酸是LNA修饰的寡核苷酸,诸如LNA硫代磷酸酯寡核苷酸,其进一步包含缀合物基团,诸如N-乙酰半乳糖胺(GalNAc)部分,诸如三价GalNAc部分。

在一些实施例中,修饰的寡核苷酸是2'-糖修饰的寡核苷酸,诸如2'-O-甲氧基乙基硫代磷酸酯寡核苷酸,诸如2'-O-甲氧基乙基硫代磷酸酯寡核苷酸,其可任选地进一步包含缀合物基团,诸如N-乙酰半乳糖胺(GalNAc)部分,诸如三价GalNAc部分。

本发明提供了包含一个或多个2'修饰的核苷的寡核苷酸的缀合物,诸如反义寡核苷酸的缀合物,诸如硫代磷酸酯反义寡核苷酸的缀合物,或LNA寡核苷酸的缀合物,诸如LNA缺口聚体(gapmer)或混聚体(mixmer),其中缀合物包含所述寡核苷酸和选自实例中所示的组B至T的缀合物部分,任选地具有接头基团,诸如定位于寡核苷酸和缀合物部分之间的烷基接头。适当地,缀合物部分可定位于寡核苷酸的5'末端或3'末端。

附图说明

图1小图A显示生成以用于测试不同的聚合酶读取LNA寡核苷酸的能力的两个单链测试模板分子的示意图。LTT1包含具有LNA寡核苷酸的片段(浅灰色),其包含8个LNA碱基和11个硫代磷酸酯主链修饰。DTT1是对照模板,其包含与LTT1相同的碱基序列但仅使用具有磷酸二酯主链的DNA碱基。(B)示出SYBR金染色的15%TBE尿素凝胶,其中DCP1与实例1的寡核苷酸LNA O1(泳道B)和DNA O1(泳道C)之间的连接反应。在泳道A中,连接反应中不存在寡核苷酸。

图2小图A示出实例2中6种不同的Eva Green ddPCR反应中微滴的荧光强度的一维图。用于每个反应的模板分子显示在每个读出泳道上方。粉色线表示手动设置的阈值线,用于分隔阳性微滴和阴性微滴。

图3显示实例3中执行的不同Eva Green ddPCR反应中微滴的荧光强度。用于在42℃下在LTT1上产生第一链拷贝1小时的酶显示在图上方(左侧6个泳道)。右侧6个泳道是对照反应,在模板上直接运行ddPCR,没有第一链合成。所用模板显示在图上方。

图4显示来自实例4的存在不同浓度的不同添加剂的情况下LTT1模板上的evagreen ddPCR中微滴的荧光强度。添加剂及其浓度显示在图上。添加剂的浓度显示在图上方。小图E显示在小图A-D中所示的反应中检测到的LTT1的定量。小图G显示存在9%PEG和含量增加的1,2-丙二醇的情况下,LTT1模板上的evagreen ddPCR中微滴的荧光强度。小图H显示小图G中阳性微滴的数量定量,示出进一步添加1,2-丙二醇不会增加阳性微滴的数量。

图5显示来自实例5的LTT1上第一链合成的ddPCR反应结果。图5小图A显示在没有PCR添加剂的情况下第一链Taq聚合酶合成上的ddPCR反应。PCR循环次数显示在每个反应的图的下方。图5小图B显示第一链合成反应期间存在10%PEG和0.31M时ddPCR反应的结果PCR循环次数显示在每个反应的图的下方。图5小图C显示没有Taq聚合酶存在的情况下相同的反应。PCR循环次数显示在每个反应的图的下方。图5小图E和F显示在有和没有10%PEG和0.31M 1.3-丙二醇添加剂的情况下,在HF缓冲液中使用phusion DNA聚合酶进行第一链合成反应的ddPCR。图5小图D显示在7个测试条件(A、B、C、D、E、F)下检测到的LTT1拷贝数的定量。

图6小图A显示SYBR金染色的15%TBE尿素凝胶分离了实例6中所述的单个捕获探针和寡核苷酸之间的连接反应。白色正方形表示从包含连接产物的凝胶切下的面积。小图B-E显示进行实例6中所述的数据处理后四个捕获探针中每一个的前10个最频繁的18个碱基对读长。输入LNA寡核苷酸的序列显示在每个表格上方。

图7.4种示例性捕获探针(i)–(iv)的关键设计特征,用于捕获例如修饰的糖,例如LNA寡核苷酸或立体定向寡核苷酸:

区域A:5'端被磷酸化以实现连接。区域A与区域G形成第一双链体(形成非线性捕获探针)。区域G和A碱基配对形成细胞内环,稳定靶标修饰的寡核苷酸向5'磷酸的定位,从而增强连接。

区域B包含反应条形码,并且是任选的,尽管对于平行测序非常有利。区域C可以包含简并核苷酸或通用碱基的区域,并且可以任选地使用,例如作为分子条形码。区域B和区域C可以采用任何顺序。

区域D对于使用例如固相引物的下一代测序应用有利,并且用于将连接产物或PCR扩增产物杂交到测序平台上(例如流通池结合引物)。或者,如果包括PCR扩增步骤,可使用包含用于测序平台的结合位点的PCR引物。区域D也可用作第一引物结合位点。

区域E是一个任选的第一引物结合位点,可与区域D重叠。

区域H是3'核苷酸的区域,其与修饰的寡核苷酸的3'端杂交,从而将修饰的寡核苷酸连接至捕获探针的5'端。区域H可以是简并序列或者可以是本文所述的预定序列。捕获探针的3'端被封闭以便连接,从而避免自我连接。本文举例说明了3'氨基修饰,但也可以使用其他3'保护基团。

区域F'示出的实施例中,捕获探针借助位于区域D下游(或可能与区域D重叠)的双链体区域内的可裂解键合自引发。

细线代表连接所示区域的任选核苷,并且如本文所述,这些可以被非核苷接头取代。

图8小图A显示SYBR金染色的15%TBE尿素凝胶,分离了实例7中所述的单个捕获探针和寡核苷酸之间的连接反应。白色正方形表示从包含连接产物的凝胶切下的面积。小图B-E显示进行实例7中所述的数据处理后四个捕获探针中每一个的前10个最频繁的18个碱基对读长。输入LNA寡核苷酸的序列显示在每个表格上方。

图9显示实例8中所述反应的前10个最频繁的15个碱基对读长。

图10小图A显示在1x 45min第一链合成反应上进行的EvaGreen ddPCR反应中微滴的荧光强度。检测到的拷贝数定量示于图10小图B中,以每ul反应的拷贝数为单位显示浓度。图10小图C显示在使用1、3或5轮第一链合成进行的反应上执行的EvaGreen ddPCR反应中微滴的荧光强度。在每个反应中检测到的拷贝数定量示于图10的小图D中,以每微升反应的拷贝数为单位显示浓度。

图11.皮下注射后4h相对于未缀合的寡核苷酸(SEQ ID 35)的肝脏富集倍数。与未缀合的寡核苷酸(SEQ ID 35)相比,GalNAc缀合的寡核苷酸(SEQ ID 22)以及SEQ ID 26显示出3.5倍的肝脏富集。

图12.皮下注射后4h相对于未缀合的寡核苷酸化合物SEQ ID 35的肝脏富集倍数。与裸寡核苷酸SEQ ID 35相比,具有C16脂肪酸缀合的寡核苷酸(SEQ ID 46)显示出12.5倍的血浆丰度。GalNAc缀合的寡核苷酸(SEQ ID 22)显示从血浆耗减。

定义

寡核苷酸

如本文所用,术语“寡核苷酸”定义为如技术人员通常理解的包含两个或以上共价连接的核苷的分子。这样的共价结合的核苷也可以称为核酸分子或寡聚物。寡核苷酸通常在实验室中通过固相化学合成然后纯化的方式制备。当提及寡核苷酸的序列时,提及的是共价连接的核苷酸或核苷的核碱基部分或其修饰的序列或顺序。在本发明的背景中,寡核苷酸是人造的,并且是化学合成的,并且可被纯化或分离。

修饰的寡核苷酸

术语修饰的寡核苷酸描述了一种寡核苷酸,其包含一个或多个糖修饰的核苷和/或修饰的核苷间键合和/或缀合物部分的存在。

在一些实施例中,修饰的寡核苷酸是治疗性寡核苷酸。

在一些实施例中,修饰的寡核苷酸包含至少两个连续的2'糖修饰的核苷。在一些实施例中,修饰的寡核苷酸包含至少两个连续的2'糖修饰的核苷,其独立地选自由LNA核苷和2'-O-甲氧基乙基核苷组成的组。在一些实施例中,修饰的寡核苷酸包含至少两个连续的LNA核苷。在一些实施例中,修饰的寡核苷酸包含至少两个连续的2'-O-甲氧基乙基核苷。在一些实施例中,修饰的寡核苷酸包含至少三个连续的2'糖修饰的核苷,其独立地选自由LNA核苷和2'-O-甲氧基乙基核苷组成的组。

在一些实施例中,修饰的寡核苷酸包含至少三个连续的LNA核苷。在一些实施例中,修饰的寡核苷酸包含至少三个连续的2'-O-甲氧基乙基核苷。在一些实施例中,修饰的寡核苷酸包含至少四个连续的2'糖修饰的核苷,其独立地选自由LNA核苷和2'-O-甲氧基乙基核苷组成的组。在一些实施例中,修饰的寡核苷酸包含至少四个连续的LNA核苷。在一些实施例中,修饰的寡核苷酸包含至少四个连续的2'-O-甲氧基乙基核苷。在一些实施例中,修饰的寡核苷酸包含至少五个连续的2'糖修饰的核苷,其独立地选自由LNA核苷和2'-O-甲氧基乙基核苷组成的组。

在一些实施例中,修饰的寡核苷酸包含在修饰的寡核苷酸的3'端至少有两个连续的2'糖修饰的核苷。在一些实施例中,修饰的寡核苷酸包含在修饰的寡核苷酸的3'端至少有三个连续的2'糖修饰的核苷。在一些实施例中,修饰的寡核苷酸在修饰的寡核苷酸的3'末端包含至少四个连续的2'糖修饰的核苷。在一些实施例中,修饰的寡核苷酸在修饰的寡核苷酸的3'末端包含至少五个连续的2'糖修饰的核苷。

在一些实施例中,修饰的寡核苷酸在3'端包含至少两个连续的2'糖修饰的核苷,其独立地选自由LNA核苷和2'-O-甲氧基乙基核苷组成的组。在一些实施例中,修饰的寡核苷酸在3'端包含至少两个连续的LNA核苷。在一些实施例中,修饰的寡核苷酸在3'端包含至少两个连续的2'-O-甲氧基乙基核苷。

在一些实施例中,修饰的寡核苷酸在3'端包含至少三个连续的2'糖修饰的核苷,其独立地选自由LNA核苷和2'-O-甲氧基乙基核苷组成的组。在一些实施例中,修饰的寡核苷酸在3'端包含至少三个连续的LNA核苷。在一些实施例中,修饰的寡核苷酸在3'端包含至少三个连续的2'-O-甲氧基乙基核苷。在一些实施例中,修饰的寡核苷酸在3'端包含至少四个连续的2'糖修饰的核苷,其独立地选自由LNA核苷和2'-O-甲氧基乙基核苷组成的组。

在一些实施例中,修饰的寡核苷酸包含至少一个或多个糖修饰的核苷,诸如一个或多个LNA核苷,并且还包含修饰的核苷间键合,诸如硫代磷酸酯核苷间键合。在一些实施例中,修饰的寡核苷酸包含至少一个或多个2'取代的核苷,例如2'-O-甲氧基乙基核苷,并且还包含修饰的核苷间键合,例如硫代磷酸酯核苷间键合。

在一些实施例中,修饰的寡核苷酸在3'末端包含LNA核苷,或在3'末端包含2'取代的核苷,诸如2'-甲氧基乙基或2-O-甲基;并且可以进一步包含硫代磷酸酯核苷间键合。优选地,修饰的寡核苷酸可以是,例如,长度为7至50个连续核苷酸,诸如长度为7-30个连续核苷酸,诸如长度为10-24个连续核苷酸,诸如长度为12-20个连续核苷酸。

主链修饰的寡核苷酸

主链修饰的寡核苷酸是一种寡核苷酸,其包含至少一个除磷酸二酯以外的核苷间键合。修饰的寡核苷酸有利地是主链修饰的寡核苷酸,诸如硫代磷酸酯寡核苷酸。在一些实施例中,修饰的寡核苷酸是硫代磷酸酯寡核苷酸,其中修饰的寡核苷酸的核苷之间至少70%的核苷间键合是硫代磷酸酯核苷间键合,诸如至少80%,诸如至少90%,诸如所有核苷间键合是硫代磷酸酯核苷间键合。

糖修饰的寡核苷酸

糖修饰的寡核苷酸是包含至少一个核苷的寡核苷酸,其中核糖被除脱氧核糖(DNA核苷)或核糖(RNA核苷)以外的部分取代。糖修饰的寡核苷酸包括2'碳被除氢或羟基以外的取代基取代的核苷,以及双环核苷(LNA)。在一些实施例中,糖修饰是除2'氟RNA以外的。

2'糖修饰的核苷

2'糖修饰的核苷是一种核苷,其在2'位置具有除H或-OH以外的取代基(2'取代的核苷)或包含能够在2'碳与核糖环中的第二个碳原子之间形成桥的2'连接双基,诸如LNA(2'-4'双基桥连)核苷。

事实上,人们已花费很多精力开发2'糖取代的核苷,并且发现许多2'取代的核苷掺入寡核苷酸后具有有益的特性。例如,2'修饰的糖可以提供增强的结合亲和力和/或增加的对寡核苷酸的核酸酶抗性。2'取代的修饰的核苷的实例是2'-O-烷基-RNA、2'-O-甲基-RNA、2'-烷氧基-RNA、2'-O-甲氧基乙基-RNA(MOE)、2'-氨基-DNA、2'-氟RNA、未锁定核酸(UNA)和2'-F-ANA核苷。有关进一步的实例,请参见例如Freier与Altmann;Nucl.AcidRes.,1997,25,4429-4443和Uhlmann;Curr.Opinion in Drug Development,2000,3(2),293-213和Deleavey和Damha,Chemistry and Biology 2012,19,937。下面是一些2'取代的修饰的核苷的示意图。

关于本发明,2'取代的糖修饰的核苷不包括像LNA那样的2'桥连的核苷。

在一些实施例中,修饰的寡核苷酸不包含2'氟修饰的核苷酸。在一些实施例中,修饰的寡核苷酸包含至少2个连续的修饰的核苷,其独立地选自2'-O-烷基-RNA、2'-O-2'-烷氧基-RNA、2'-O-甲氧基乙基-RNA(MOE)、2'-氨基-DNA和LNA核苷组成的组-这些是在2'位置包含一个大体积侧基修饰的核苷。

锁定核酸(LNA)

“LNA核苷”是一种2'-修饰的核苷,其包含链接所述核苷的核糖环的C2'和C4'的双基(也称为“2'-4'桥”),其限制或锁定核糖环的构象。这些核苷在文献中也称为桥连核酸或双环核酸(BNA)。将LNA掺入互补RNA或DNA分子的寡核苷酸中时,核糖构象的锁定与杂交的增强亲和力(双链体稳定化)有关。这可以常规地通过测量寡核苷酸/互补双链体的解链温度确定。

非限制性的示例性LNA核苷公开于WO 99/014226、WO 00/66604、WO 98/039352、WO2004/046160、WO 00/047599、WO 2007/134181、WO 2010/077578、WO 2010/036698、WO2007/090071、WO 2009/006478、WO 2011/156202、WO 2008/154401、WO 2009/067647,WO2008/150729、Morita等人,Bioorganic&Med.Chem.Lett.12,73-76、Seth等人J.Org.Chem.2010,Vol 75(5)pp.1569-81和Mitsuoka等人,Nucleic Acids Research2009,37(4),1225-1238和Wan和Seth,J.Medical Chemistry 2016,59,9645-9667中。

其他非限制性的示例性LNA核苷公开于方案1中。

方案1:

特定的LNA核苷是β-D-氧-LNA、6'-甲基-β-D-氧LNA诸如(S)-6'-甲基-β-D-氧-LNA(ScET)和ENA。

一种特别有利的LNA是β-D-氧基-LNA。

2'取代的寡核苷酸

在一些实施例中,核苷修饰的寡核苷酸包含至少一个2'取代的核苷,例如至少一个3'末端2'取代的核苷。在一些实施例中,2'取代的寡核苷酸是缺口聚体寡核苷酸、混聚体寡核苷酸或总聚体(totalmer)寡核苷酸。在一些实施例中,2'取代选自由2'甲氧基乙基(2'-O-MOE)或2'-O-甲基组成的组。在一些实施例中,核苷修饰的寡核苷酸的3'核苷酸是2'取代的核苷,诸如2'-O-MOE或2'-O-甲基。在一些实施例中,寡核苷酸不包含多于四个的连续核苷修饰的核苷。在一些实施例中,寡核苷酸不包含多于三个的连续核苷修饰的核苷。在一些实施例中,寡核苷酸在3'末端包含2个2'-O-MOE修饰的核苷酸。在一些实施例中,核苷修饰的寡核苷酸包含硫代磷酸酯核苷间键合,并且在一些实施例中,存在于寡核苷酸中的至少75%的核苷间键合是硫代磷酸酯核苷间键合。在一些实施例中,修饰的核苷寡核苷酸的所有核苷间键合都是硫代磷酸酯核苷间键合。硫代磷酸酯连接的寡核苷酸广泛用于哺乳动物的体内应用,包括其作为治疗药物的用途。

在一些实施例中,糖修饰的寡核苷酸的长度为7-30个核苷酸,诸如8-25个核苷酸。在一些实施例中,糖修饰的寡核苷酸的长度为10-20个核苷酸,诸如12-18个核苷酸。

核苷寡核苷酸可任选地被缀合,例如与GalNaC缀合物。如果它们被缀合,那么缀合物基团优选位于除寡核苷酸的3'位置以外,例如,缀合可以在5'末端。

LNA寡核苷酸

在一些实施例中,核苷修饰的寡核苷酸包含至少一个LNA核苷,例如至少一个3'末端LNA核苷。在一些实施例中,LNA寡核苷酸是缺口聚体寡核苷酸、混聚体寡核苷酸或总聚体寡核苷酸。在一些实施例中,LNA寡核苷酸不包含多于四个的连续LNA核苷。在一些实施例中,LNA寡核苷酸不包含多于三个的连续LNA核苷。在一些实施例中,LNA寡核苷酸在3'末端包含2个LNA核苷酸。

缺口聚体

在一些实施例中,核苷修饰的寡核苷酸可以是缺口聚体寡核苷酸。

如本文所用,术语缺口聚体是指反义寡核苷酸,其包含RNase H募集寡核苷酸(缺口-‘G’)的区域,其在5'侧翼和3'侧翼由侧翼区域(‘F’)侧接,该侧翼区域包含一个或多个核苷修饰的核苷酸,例如亲和力增强的修饰的核苷(在侧翼或翼中)。缺口聚体的长度通常为12-26个核苷酸,在一些实施例中,其可包含6-14个DNA核苷的中央区域(G),其两侧侧接侧翼区域F,该侧翼区域F包含至少一个核苷修饰的核苷酸,例如1-6个核苷修饰的核苷(F

在一些实施例中,侧翼区域中的所有核苷都是2'-O-甲氧基乙基核苷(MOE缺口聚体)。

LNA缺口聚体

术语LNA缺口聚体是缺口聚体寡核苷酸,其中侧翼中的至少一种亲和力增强的修饰的核苷是LNA核苷。在一些实施例中,核苷修饰的寡核苷酸是LNA缺口聚体,其中寡核苷酸的3'末端核苷是LNA核苷。在一些实施例中,寡核苷酸的2个3'末端核苷是LNA核苷。在一些实施例中,LNA缺口聚体的5'侧翼和3'侧翼均包含LNA核苷,并且在一些实施例中,核苷修饰的寡核苷酸是LNA寡核苷酸,例如缺口聚体寡核苷酸,其中寡核苷酸的所有核苷是LNA核苷或DNA核苷。

混合翼缺口聚体

术语混合翼缺口聚体或混合侧翼缺口聚体是指其中至少一个侧翼区域包含至少一个LNA核苷和至少一个非LNA修饰的核苷,诸如至少一个2'取代的修饰的核苷,诸如,例如2'-O-烷基-RNA、2'-O-甲基-RNA、2'-烷氧基-RNA、2'-O-甲氧基乙基-RNA(MOE)、2'-氨基-DNA、2'-氟-RNA和2'-F-ANA核苷。在一些实施例中,混合翼缺口聚体具有一个仅包含LNA核苷(例如5'或3')的侧翼,而另一个侧翼(分别为3'或5')包含2'取代的修饰的核苷并且任选地包含LNA核苷。在一些实施例中,混合翼缺口聚体在侧翼中包含LNA核苷和2'-O-MOE核苷。

混聚体

混聚体是一种既包含核苷修饰的核苷又包含DNA核苷的寡核苷酸,其中该寡核苷酸不包含超过4个连续的DNA核苷。混聚体寡核苷酸通常用于核酸靶标非RNA聚合酶(RNAseH)介导的调控,例如用于微RNA(microRNA)的抑制或用于mRNA前体(pre-mRNA)的剪接转换调控。

总聚体

总聚体是一种核苷修饰的寡核苷酸,其中存在于寡核苷酸中的所有核苷均是核苷修饰的。总聚体可以仅包含一种类型的核苷修饰,例如可以是完整的2'-O-MOE或完整的2'-O-甲基修饰的寡核苷酸,或完整的LNA修饰的寡核苷酸,或可以包含不同核苷修饰的混合物,例如LNA核苷和2'-O-MOE核苷的混合物。在一些实施例中,总聚体可包含一个或两个3'末端LNA核苷。

微小寡核苷酸

微小寡核苷酸是长度为7-10个核苷酸的寡核苷酸,其中寡核苷酸中的每个核苷均为LNA核苷。微小寡核苷酸已知是靶向microRNA的特别有效的设计。

立体定向寡核苷酸

在一些实施例中,修饰的寡核苷酸是立体定向寡核苷酸。立体定向寡核苷酸是一种寡核苷酸,其中至少一个核苷间键合是立体定向核苷间键合。

立体定向硫代磷酸酯寡核苷酸是一种寡核苷酸,其中至少一个核苷间键合是立体定向硫代磷酸酯核苷间键合。

RNA干扰(RNAi)和小干扰RNA(siRNA)

在一些实施例中,修饰的寡核苷酸可以是RNAi分子,例如siRNA或siRNA有义和/或反义链。在本文中,术语“RNA干扰(RNAi)分子”是指通过RNA减少沉默复合物(RISC)抑制RNA表达或翻译的任何分子。小干扰RNA(siRNA)通常是包含有义和反义寡核苷酸的双链RNA复合物,当将其施用于细胞时,会导致反义链掺入RISC复合物(siRISC)中,从而导致细胞中互补RNA靶标核酸的翻译或降解的RISC相关抑制。有义链也称为过客链,反义链也称为前导链。小发夹RNA(shRNA)是单个核酸分子,其形成能够通过RISC降解mRNA的发夹结构。RNAi核酸分子可以化学合成(对于siRNA复合体而言是典型的)或通过体外转录合成,或从载体表达。

通常,siRNA的反义链(或shRNA的反义区域)的长度为17-25个核苷酸,诸如19-23个核苷酸。在siRNA复合物中,反义链和有义链形成双链体,其可包含例如1-3个核苷酸的3'末端突出端,或者可以是平末端(双链体的一个或两个末端均无突出端)。

应当认识到的是,RNAi可以由较长的双链核糖核酸(dsRNA)底物介导,该dsRNA底物在细胞内被加工成siRNA(该过程被认为涉及dsRNA内切核酸酶DICER)。Dicer底物的有效扩展形式已在US 8,349,809和US 8,513,207中进行了描述,在此通过引用并入。

RNAi试剂可使用修饰的核苷酸间键合和高亲和力的核苷进行化学修饰,例如2'-4'双环核糖修饰的核苷,包括LNA和cET。参见例如公开了2'-O-甲基修饰的siRNA的WO2002/044321,公开了在称为siLNA的siRNA复合物中使用LNA核苷的WO2004083430,以及公开了在诸如siLNA复合物的siRNA中使用不连续过客链的WO2007107162。WO03006477公开了RNAi的siRNA和shRNA(也称为stRNA)寡核苷酸介质。Harborth等人,Antisense NucleicAcid Drug Dev.2003年4月;13(2):83-105涉及小干扰RNA和短发夹RNA的序列、化学和结构变异,以及对哺乳动物基因沉默的影响。

应当认识到的是,本发明的方法能够同时对siRNA复合物的两条链进行测序。

反义寡核苷酸

在一些实施例中,修饰的寡核苷酸是反义寡核苷酸。

如本文所用,术语“反义寡核苷酸”定义为能够通过与靶标核酸特别是与靶标核酸上的连续序列杂交来调节靶标基因的表达的寡核苷酸。反义寡核苷酸基本上不是双链的,因此不是siRNA或shRNA。反义寡核苷酸是单链的。应当理解的是,单链寡核苷酸可以形成发夹或分子间双链体结构(同一寡核苷酸的两个分子之间的双链体),只要其内部或相互间的自身互补程度小于寡核苷酸全长的50%。

在一些实施例中,反义寡核苷酸是糖修饰的寡核苷酸。

核苷酸

核苷酸是寡核苷酸和多核苷酸的组成部分,并且出于本发明的目的,包括天然存在的和非天然存在的核苷酸。实际上,核苷酸诸如DNA核苷酸和RNA核苷酸包括核糖部分、核碱基部分和一个或多个磷酸基团(在核苷中不存在)。核苷和核苷酸也可以可互换地称为“单元”或“单体”。

修饰的核苷

如本文所用,术语“修饰的核苷”或“核苷修饰”是指与同等的DNA或RNA核苷相比,通过引入糖部分或(核)碱基部分的一种或多种修饰而被修饰的核苷。在一个优选的实施例中,修饰的核苷包含修饰的糖部分。术语修饰的核苷在本文中还可与术语“核苷类似物”或修饰的“单元”或修饰的“单体”互换使用。具有未修饰的DNA糖部分的核苷或RNA糖部分的核苷在本文中称为DNA或RNA核苷。如果允许Watson Crick碱基配对,则DNA核苷碱基区域或RNA核苷碱基区域中修饰的核苷通常仍称为DNA或RNA。

修饰的核苷间键合

如技术人员通常所理解的,术语“修饰的核苷间键合”定义为除磷酸二酯(PO)键合以外的键合,其将两个核苷共价偶联在一起。因此,本发明的寡核苷酸可包含修饰的核苷间键合。在一些实施例中,与磷酸二酯键合相比,修饰的核苷间键合增加了寡核苷酸的核酸酶抗性。对于天然存在的寡核苷酸,核苷间键合包括在相邻核苷之间产生磷酸二酯键的磷酸基团。修饰的核苷间键合可用于稳定体内使用的寡核苷酸,并可用于防止本发明的寡核苷酸中DNA核苷区域或RNA核苷区域的核酸酶裂解,例如在缺口聚体寡核苷酸的缺口区域内以及在修饰的核苷区域中,例如区域F和F'。

在一个实施例中,寡核苷酸包含一个或多个由天然磷酸二酯修饰的核苷间键合,例如一个或多个修饰的核苷间键合,其例如对核酸酶的攻击更具抗性。核酸酶抗性可以通过在血清中孵育寡核苷酸或通过使用核酸酶抗性测定(例如蛇毒磷酸二酯酶(SVPD))来确定,都是本领域中众所周知的。能够增强寡核苷酸的核酸酶抗性的核苷间键合称为抗核酸酶核苷间键合。在一些实施例中,寡核苷酸或其连续核苷酸序列中至少50%的核苷间键合被修饰,诸如至少60%,诸如至少70%,诸如至少80%,诸如至少90%的寡核苷酸或其连续核苷酸序列中的核苷间键合是抗核酸酶核苷间键合。在一些实施例中,寡核苷酸的所有核苷间键合或其连续核苷酸序列是抗核酸酶核苷间键合。应当认识到的是,在一些实施例中,将本发明的寡核苷酸与非核苷酸官能团诸如缀合物连接的核苷可以是磷酸二酯。

优选的修饰的核苷间键合是硫代磷酸酯。

硫代磷酸酯核苷间键合由于核酸酶抗性、有益的药代动力学和易于制造而特别有益。在一些实施例中,寡核苷酸或其连续核苷酸序列中至少50%的核苷间键合是硫代磷酸酯,诸如至少60%,诸如至少70%,诸如至少80%,诸如至少90%的寡核苷酸或其连续核苷酸序列中的核苷间键合是硫代磷酸酯。在一些实施例中,寡核苷酸的所有核苷间键合或其连续核苷酸序列是硫代磷酸酯。

抗核酸酶键合,例如硫代磷酸酯键合,在与靶标核酸形成双链体时能够募集核酸酶的寡核苷酸区域中特别有用,诸如缺口聚体的区域G。然而,硫代磷酸酯键合也可用于非核酸酶募集区域和/或亲和力增强区域,如缺口聚体的区域F和F'。在一些实施例中,缺口聚体寡核苷酸可在区域F或F'或同时在区域F和F'中包含一个或多个磷酸二酯键合,其中区域G中的核苷间键合可以完全是硫代磷酸酯。

有利地,寡核苷酸的连续核苷酸序列中的所有核苷间键合都是硫代磷酸酯键合。

应当认识到的是,如EP2 742 135中所公开的,反义寡核苷酸可包含其他核苷间键合(除磷酸二酯和硫代磷酸酯以外),例如烷基膦酸酯/甲基膦酸酯间核苷,其根据EP2 742135可以例如以其他方式被DNA硫代磷酸酯的缺口区域中所耐受。

核碱基

术语核碱基包括存在于核苷和核苷酸中的嘌呤(例如腺嘌呤和鸟嘌呤)和嘧啶(例如尿嘧啶、胸腺嘧啶和胞嘧啶)部分,其在核酸杂交中形成氢键。在本发明的背景中,术语核碱基也涵盖修饰的核碱基,其可以不同于天然存在的核碱基,但是在核酸杂交期间起作用。在此背景中,“核碱基”是指天然存在的核碱基,例如腺嘌呤、鸟嘌呤、胞嘧啶、胸苷、尿嘧啶、黄嘌呤和次黄嘌呤,以及非天然存在的变体。此类变体例如描述于Hirao等人(2012)Accounts of Chemical Research第45卷第2055页和Bergstrom(2009)Current Protocolsin Nucleic Acid Chemistry Suppl.37 1.4.1中。

在一些实施例中,核碱基部分被修饰,其方式是将嘌呤或嘧啶改变为修饰的嘌呤或嘧啶,诸如取代的嘌呤或取代的嘧啶,诸如选自异胞嘧啶、假异胞嘧啶、5-甲基胞嘧啶、5-巯基胞嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、5-溴尿嘧啶、5-噻唑尿嘧啶、2-硫代尿嘧啶、2'硫代胸腺嘧啶、肌苷、二氨基嘌呤、6-氨基嘌呤、2-氨基嘌呤、2,6-二氨基嘌呤和2-氯-6-氨基嘌呤的核碱基。

核碱基部分可以由每个相应核碱基的字母代码来表示,例如A、T、G、C或U,其中每个字母可以任选地包括具有同等功能的修饰的核碱基。例如,在示例性的寡核苷酸中,核碱基部分选自A、T、G、C和5-甲基胞嘧啶。任选地,对于LNA缺口聚体,可以使用5-甲基胞嘧啶LNA核苷。

核碱基序列

核碱基序列是指存在于寡核苷酸或多核苷酸中的核碱基的序列。寡核苷酸的核碱基序列通常是指A、T、C和G核碱基的序列。因此,在通过测序方法鉴定的核碱基序列中可将寡核苷酸中5-甲基胞嘧啶碱基的存在鉴定为的胞嘧啶残基。同样,在测序方法中可将尿嘧啶核苷碱基可鉴定为酪氨酸碱基。

核酸序列

术语“核酸序列”是指一种核酸分子,其包含核苷酸的连续序列,并且可以包含存在于修饰的寡核苷酸或其反向互补序列中的核苷酸序列。

互补性

术语“互补性”描述了核苷/核苷酸的Watson-Crick碱基配对的能力。Watson-Crick碱基对是鸟嘌呤(G)-胞嘧啶(C)和腺嘌呤(A)-胸腺嘧啶(T)/尿嘧啶(U)。应当理解的是,寡核苷酸可包含具有修饰的核碱基的核苷,例如,经常使用5-甲基胞嘧啶代替胞嘧啶,因此,术语互补性涵盖未修饰的和修饰的核碱基之间的Watson Crick碱基配对(参见例如Hirao等人(2012)Accounts of Chemical Research第45卷第2055页和Bergstrom(2009)Current Protocols in Nucleic Acid Chemistry Suppl.37 1.4.1)。

同一性(核苷酸序列)

如本文所用,术语“同一性”是指核酸分子(例如寡核苷酸)中连续核苷酸序列的核苷酸比例(以百分比表示),该核酸分子跨连续核苷酸序列与参考序列(例如序列基序)相同。因此,通过计算两个序列(在本发明的化合物的连续核苷酸序列中和在参考序列中)相同的比对碱基(匹配)数,将该数除以寡核苷酸的核苷酸总数再乘以100来计算同一性百分比。因此,同一性百分比=(匹配数x 100)/比对区域的长度(例如,连续核苷酸序列)。在计算连续核苷酸序列的同一性百分比时,不允许插入和删除。应当理解的是,在确定同一性时,只要保留了形成Watson Crick碱基配对的核碱基的功能能力,就不考虑核碱基的化学修饰(例如,在计算同一性百分比时,认为5-甲基胞嘧啶与胞嘧啶相同)。

杂交

如本文所用,术语“杂交”应当理解为在相对链上的碱基对之间形成氢键从而形成双链体的两条核酸链(例如寡核苷酸和靶标核酸)。

如本文所用,术语“杂交”应当理解为在相对链上的碱基对之间形成氢键从而形成双链体的两条核酸链(例如寡核苷酸和靶标核酸)。两条核酸链之间结合的亲和力是杂交的强度。通常用解链温度(Tm)来描述,解链温度(Tm)定义为一半寡核苷酸与靶标核酸形成双链体的温度。

同一性(氨基酸序列)

同一性:两个氨基酸之间的相关性由参数“同一性”描述。出于本发明的目的,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mo/.Biol.5 48:443-453)确定两个氨基酸序列之间的同一性程度,该算法在EMBOSS软件包(EMBOSS:The European MolecularBiology Open Software Suite,Rice等人,2000,Trends in Genetics 16:276-277;http://emboss.org)的Needle程序中实现,优选3.0.0或更高版本。使用的任选参数是缺口打开罚分10、缺口延伸罚分0.5和EBLOSUM62(EMBOSS的BLOSUM62版本)替换矩阵。使用Needle标有“最长同一性”的输出(使用10-nobrief选项获得)作为同一性百分比,其计算方式如下:(相同残基x 100)/(比对长度-比对缺口总数)。

连接

连接是指两个核酸片段(诸如寡核苷酸)的共价链接。连接通常涉及一个核酸片段上的3'-OH基团与另一核酸片段上的5'磷酸基团之间形成磷酸键,并且可由连接酶诸如T4DNA连接酶催化。

捕获探针寡核苷酸

如本文所述,3'捕获探针寡核苷酸,也称为捕获探针寡核苷酸,是包含第一引物结合位点的寡核苷酸,并且在本发明的方法中,其连接至修饰的寡核苷酸的3'末端,从而实现使用修饰的寡核苷酸作为模板进行基于聚合酶的链延伸。第一引物结合位点也可用作测序引物诸如固相结合的引物的结合位点。

捕获探针可以包含与修饰的寡核苷酸的3'区域互补的3'区域(或者是简并区域),从而捕获寡核苷酸的3'区域,其促进捕获探针与修饰的寡核苷酸的连接。或者,可进行夹板连接。

在一些实施例中,对于基于引物的测序,捕获探针寡核苷酸可进一步包含测序引物结合位点,例如固相结合的引物。因此,捕获探针可以包含用于与大规模平行测序中使用的固体支持物结合的结合位点,例如流通池结合位点,其对于第一引物侧可以是共同的区域,或者可以是与第一引物结合位点分离或重叠的独立区域。应当理解,当测序引物结合位点与第一引物结合位点不同时,测序引物结合位点在上游(即第一引物结合位点的5'),从而保证在从捕获探针的第一链合成中掺入测序引物结合位点。

在一些实施例中,本发明的捕获探针包含可裂解键合基团,例如用于自引发捕获探针寡核苷酸。自引发捕获探针可用于在不添加第一引物的情况下,凭借捕获探针内形成双链体的两个区域之间的两个自身互补区域(在本文中可称为第二双链体区域)启动5'-3'链延伸(第一链合成),其中自引发捕获探针包含可裂解键合,该可裂解键合在裂解时为5'-3'聚合酶介导的链延伸提供底物(例如包含3'末端-OH基团的双链体区域)。可裂解键合可位于自身互补区域的3'末端区域附近。可裂解键合可以是任何可裂解基团,例如可以是UV可裂解基团或酶促裂解基团。一个优选的裂解基团是包含错配的RNA核苷的区域,其可以使用RNaseH2酶裂解。为了有效地裂解RNaseH2,错配的RNA核苷可以侧接3或4个3'(和任选的5')核苷,其在两个远端区域之间形成捕获探针双链体的一部分。

在优选的实施例中,捕获探针是包含至少一个5'DNA核苷的寡核苷酸,其用于通过连接(例如,使用T4 DNA连接酶,可以使用其他连接方法)“捕获”核苷修饰的寡核苷酸。捕获可通过捕获探针的5'端连接至修饰的核苷寡核苷酸的3'核苷酸来进行。在一些实施例中,可能有利的是,捕获探针进一步包含与靶标修饰的寡核苷酸序列上的区域互补的区域,该区域用于在连接步骤之前通过核酸杂交(Watson-Crick碱基配对)捕获靶标核酸序列。在捕获探针的区域和修饰的寡核苷酸上的互补区域之间使用杂交有效地富集了局部底物浓度,从而增强了连接步骤的功效。PCT/EP2017/078695公开了可以在本发明的方法中使用的捕获探针。捕获探针可进一步包含PCR引物结合位点,以用于扩增步骤(PCT步骤),其中包括在本发明的方法中。

本发明提供或使用捕获探针寡核苷酸,用于糖修饰的寡核苷酸的平行测序,该寡核苷酸包含5'-3':

A.5'区域,其包含至少3个预定序列的连续核苷酸,其中5'末端核苷酸是具有末端5'磷酸基团的核苷酸。

B.任选地,平行测序反应条形码区域包括预定核苷酸序列的区域,

C.任选地,简并或预定核苷酸的区域,位于区域B的3'或区域B的5'

D.固相测序引物结合位点

E.任选地,第一引物结合位点

F.任选地,接头区域(可以是核苷酸序列)

G.与第一区段的预定序列A(第一双链体区域)互补的核苷酸的连续序列

H.至少2个核苷酸的区域,其中3'末端的核苷酸是具有封闭的3'末端基团的末端核苷酸。

示意图参见图7。在捕获探针不包含第一引物结合位点的实施例中,可将第一引物设计成与区域D杂交(即,区域D可以既是测序引物结合位点又用作第一引物结合位点)。

本发明提供或使用捕获探针寡核苷酸,用于糖修饰的寡核苷酸的平行测序,该寡核苷酸包含5'-3':

A.5'区域,其包含至少3个预定序列的连续核苷酸,其中5'末端核苷酸是具有末端5'磷酸基团的核苷酸。

B.任选地,平行测序反应条形码区域包括预定核苷酸序列的区域,

C.任选地,简并或预定核苷酸的区域,位于区域B的3'或区域B的5'

D.固相测序引物结合位点

E.任选地,第一引物结合位点

F.任选地,接头区域(可以是核苷酸序列)

F'与第一引物结合位点和/或固相测序引物结合位点形成双链体的区域,其中双链体包含可裂解接头,

G.与第一区段的预定序列A(第一双链体区域)互补的核苷酸的连续序列

H.至少2个核苷酸的区域,其中3'末端的核苷酸是具有封闭的3'末端基团的末端核苷酸。

区域F'的可裂解接头的裂解留下3'末端,其可用于第一链合成,而无需使用外源添加的第一引物(即形成自引发捕获探针)。

参见图7作为可用于本发明方法的示例性捕获探针的实例:

在一些实施例中,区域A包含预定序列的至少3个连续核苷酸或由其组成,其中5'末端核苷酸是包含5'磷酸基团的DNA核苷酸。至少3个连续核苷酸与区域G(第一双链体区域)互补并且可以与其杂交。在一些实施例中,区域A的至少3个连续核苷酸是DNA核苷酸。

在一些实施例中,区域A包含至少3个连续核苷酸或由其组成,诸如3-10个连续核苷酸,诸如3-10个DNA核苷酸。

区域B可以用作或是平行测序的“反应条形码”区域,其包含预定核苷酸序列的区域,诸如3-20个核苷酸的区域,诸如DNA核苷酸。捕获探针包含区域B是有利的,因为其允许在常规平行测序轮次中在测序之前合并来自分离的捕获探针连接的样本。因此,具有不同的区域B序列的不同捕获探针的使用允许从分离的捕获探针连接进行序列数据的测序后分离。

区域C是位于区域A的3'的核苷酸的任选序列,其可以包含预定序列或简并序列,或者在一些实施例中同时包含预定序列部分和简并序列部分。当存在时,区域C的长度可以根据用途进行调节。当使用简并序列时,它可以在随后的测序步骤中允许扩增产物的“分子条形码”,从而确定特定的扩增产物是否独特。这允许比较定量存在于寡核苷酸异质混合物中的不同寡核苷酸。在一些实施例中,区域C包含3-30个简并的连续核苷酸,例如3-30个简并的连续DNA核苷酸。在一些实施例中,区域C包含通用核苷酸,例如肌苷核苷酸。

已知的是,某些序列可能会在PCR期间优先扩增,因此,通过计算源自简并序列的遗传“条形码序列”的出现,您可以确定扩增前的相对量(参见例如Kielpinski和Vinter,NAR(2014)42(8):e70)。

在一些实施例中,区域C引入半简并序列,其允许条形码序列和预定序列二者的益处。额外的益处是条形码序列的质量控制(参见例如Kielpinski等人,Methods inEnzymology(2015)558卷,第153-180页)。半简并序列在每个位置都有一个选定的半简并核碱基(根据需要定义半简并-添加IUPAC代码,R、Y、S、W、K、M、B、D、H和V(参见表3)。

在一些实施例中,区域C同时具有简并序列和预定序列,或者同时具有简并序列和半简并序列,或者同时具有预定序列和半简并序列,或者具有简并序列、预定序列和半简并序列。

如果区域C包含预定序列,它可以例如在第一引物位点的上游提供一个替代的或嵌套的引物位点,使用嵌套的引物位点是众所周知的减少PCR扩增期间非特异性结合的工具。在一些实施例中,区域C包含3-30个预定的连续核苷酸,例如3-30个预定的连续DNA核苷酸。

在一些实施例中,捕获探针不包含区域C。

应当理解的是,功能上区域C可以位于区域B的5'端或区域B的3'端。

在一些实施例中,当存在时,区域C包含至少3个连续的简并核苷,例如3、4、5、6、7、8、9或10个连续的简并核苷或由其组成。

区域D是固相引物结合位点,也称为测序引物结合位点,用于在可选的克隆扩增以及随后的平行测序之前,将衔接子连接产物或可选的由衔接子连接产物制备的PCR产物捕获到附接至固相支持物的寡核苷酸上。区域D也可用作第一引物结合位点以启动第一链合成。

在自引发捕获探针中,区域D可以形成双链体(第二双链体)的一部分,该双链体与下游(3')区域(F')杂交,该区域包含可裂解键合,诸如错配的RNA核苷酸,只要这不损害区域D与结合到固相支持物上的引物的结合(即在区域F'裂解后保持测序引物结合位点的完整性)。

区域E是第一引物结合位点,用于启动第一链合成。将区域D用作第一个引物结合位点时,可能不需要包括区域E。因此,功能上第一引物结合位点区域E可以与固相引物结合位点(D)相同或可以与区域D部分重叠。

在本发明的自引发捕获探针中,区域E可以形成双链体(第二双链体)的一部分,该双链体与下游(3')区域(F')杂交,该区域包含可裂解键合,诸如错配的RNA核苷酸

区域G是与区域A互补的核苷酸区域,其与区域A形成双链体。区域G不包含与区域A互补的RNA核苷是有益的,同样有益的是,存在于区域G的与捕获探针的5'末端核苷(区域A的5'末端核苷)互补并杂交的核苷是DNA核苷。这会导致区域A和G杂交时DNA/DNA双链体的形成。在一些实施例中,区域G的两个或三个3'末端核苷是DNA核苷。在一些实施例中,区域G的所有核苷均为DNA核苷。在一些实施例中,区域G包含与区域A互补并且可以与其杂交的至少3个连续核苷酸。在一些实施例中,区域G的至少3个连续核苷酸是DNA核苷酸。

在一些实施例中,区域G包含3-10个连续核苷酸,例如3-10个DNA核苷酸或由其组成。在一些实施例中,区域A和区域G的核苷酸是DNA核苷酸。互补序列A和G的长度和组成(例如G/C与A/T)可用于调节杂交强度,从而允许捕获探针的优化。同样应当认识到的是,在互补序列内引入错配可用于降低杂交强度(参见例如WO2014110272)。在一些实施例中,区域A和G不形成连续的互补序列,但是由于部分互补,在一些实施例中,区域A和区域G在与样本混合时形成双链体。区域A和区域G的3'末端碱基对应当是互补碱基对,在某些实施例中,区域A和区域G的两个或三个末端碱基对是互补碱基对。在一些实施例中,这些3'碱基对是DNA碱基对。

区域H的作用是将捕获探针寡核苷酸与要检测、捕获、测序和/或定量的核苷修饰的寡核苷酸杂交。

区域H是至少两个或三个核苷酸的区域,当其互补序列的区域A和区域G杂交时,形成3'突出端。区域H的3'末端核苷在3'位置被封闭(即不包含3'-OH基团)。

在一些实施例中,区域H具有至少3个核苷酸的长度。区域H的最佳长度可以至少取决于要捕获的寡核苷酸的长度,并且本发明人发现,区域H可以以2个核苷酸的重叠起作用,例如当使用核糖核酸酶(RNase)处理的样本时,优选是至少3个核苷酸。

在一些实施例中,区域H包含简并序列或半简并序列,其允许在不事先了解寡核苷酸序列的情况下捕获寡核苷酸。在不事先了解其序列的情况下捕获寡核苷酸在从具有所需生物分布的不同寡核苷酸序列的文库中鉴定特定的寡核苷酸,或用于鉴定部分寡核苷酸降解产物特别有用。本发明的探针和方法也可用于捕获和鉴定适体。

在一些实施例中,区域H包含预定序列,从而允许捕获具有已知序列的核苷修饰的寡核苷酸。预定捕获区域H的使用适用于捕获、检测和定量体内治疗性寡核苷酸,例如用于临床前或临床开发或随后用于确定患者来源材料中的局部组织或细胞浓度或暴露情况。患者中化合物浓度的确定对于优化患者中治疗性寡核苷酸的剂量可能很重要。

在一些实施例中,区域H包含高亲和力的修饰的核苷,例如一个或多个LNA核苷。在区域H中使用高亲和力的修饰的核苷诸如LNA允许使用核苷酸的较短区域,同时允许有效捕获修饰的寡核苷酸。就LNA修饰的寡核苷酸这一方面,LNA/LNA杂交体特别强固。应当理解,通过在区域H中选择性使用高亲和力的修饰的核苷,可以优化捕获功效。

区域H可以是预定核苷酸序列或简并(或部分简并)序列的区域。在已知修饰寡核苷酸的3'区域的情况下,可以使用预定的核苷酸序列。或者在修饰的寡核苷酸群体的3'区域内可能存在异质性,区域H的简并序列可用于连接未知序列的修饰寡核苷酸。在一些实施例中,区域H包含或包含至少4个连续的简并核苷,例如4、5、6、7、8、9、10、11或12个连续的简并核苷。

在一些实施例中,当存在区域H时,区域A、B、C、D和E的核苷是DNA核苷。

区域F是一个任选区域,在图7中由连接区域E和G的细线示出。在没有区域E的情况下,它可以将区域D和区域G或区域D或区域E链接到区域F'。在一些实施例中,捕获探针寡核苷酸不包含非核苷接头。

区域F可以用于促进捕获探针区域A和G与第一双链体区域杂交,并且区域F可以是核苷区域或可以包含非核苷酸接头。在一些实施例中,存在区域F,并且区域F包含至少3或4个核苷酸,诸如至少3或4个DNA核苷酸,诸如4-25个核苷酸。

区域F的关键功能是允许在区域A和区域G之间形成双链体(第一双链体),并且在自引发捕获探针实施例中,在区域F'和区域E之间,或在区域F'和区域D之间,或在区域F'和区域D和区域E重叠之间形成第二双链体,因此区域F可在捕获探针内形成分子内发夹结构。然而,应当认识到的是,在一些实施例中,不需要区域F,例如,当区域D(以及任选区域B和/或区域C)能够形成允许区域A和区域G之间形成双链体的分子内发夹时。在自引发捕获探针实施例中,设想区域F是有利的。

核苷酸区域可以包含或不包含阻止聚合酶通读的修饰(例如,反向核苷酸键合)。

防止DNA聚合酶从区域D到区域G的通读的优点,例如通过非核苷酸接头或抑制聚合酶的修饰,是它阻止了替代模板分子的形成。这样的替代模板分子导致对捕获探针5'区域上的核苷修饰的寡核苷酸特异的引物错误引发。

在本发明的一些实施例中,接头部分F可以是允许区域A和区域G杂交的核苷酸区域。

在一些实施例中,区域F包含聚合酶阻断接头,诸如C

夹板连接

在某些实施例中,3'捕获探针可以是线性捕获探针。对于线性捕获探针,将夹板连接引物与线性捕获探针结合使用可能是有利的:夹板连接引物与捕获探针的5'区域和修饰的寡核苷酸的3'区域杂交,从而比对要连接的末端。

阻断DNA聚合酶

一种修饰或接头部分,其阻断DNA聚合酶在接头部分或修饰上的通读,导致链延伸终止。

特异性引物

特异性引物是包含与引物结合位点互补的序列的引物。应当理解的是,关于引物和引物结合位点的术语“特异性”可能需要考虑到要使用的模板分子,即捕获探针或衔接子中的引物结合位点在一些实施例中可以经工程化以便将引物结合位点呈现在由包含捕获探针或衔接子的核酸分子制备的互补核酸分子中。

第一引物

如本文所用,第一引物是指对捕获探针的区域特异的的引物,当与捕获探针寡核苷酸/修饰的寡核苷酸连接产物杂交时,该引物用于启动聚合酶介导的链延伸(第一链合成),诸如本文所述的区域D或E。因此,第一引物包含与捕获探针寡核苷酸上的区域互补的序列,并且可以进一步包含其他区域,诸如测序引物结合位点。第一引物可以进一步包含用于结合至大规模平行测序中使用的固体支持物的结合位点,诸如流通池结合位点。第一引物可以进一步包含PCR引物结合位点,以用于扩增步骤(PCT步骤),其中包括在本发明的方法中。第一引物可以为例如长度为15-30个核苷酸,并且可以是例如DNA寡核苷酸引物。

如本文所述,在一些实施例中,捕获探针是自引发的,不需要外源添加的第一引物来启动第一链合成。

聚合酶介导的5'-3'链延伸

如本文所用,聚合酶介导的5'-3'链延伸是指当与捕获探针寡核苷酸/修饰的寡核苷酸连接产物杂交时,聚合酶介导的捕获探针寡核苷酸/修饰的寡核苷酸连接产物的互补链从第一引物中延伸,这一过程可以由核酸聚合酶诸如DNA聚合酶或逆转录酶介导。如本文所述,实施例提供了可用于鉴定合适的聚合酶和实验条件的测定,该聚合酶和实验条件能够在修饰的寡核苷酸上通读(即反转录)。因此,聚合酶是能够在修饰的寡核苷酸序列上反转录以提供包含整个修饰的寡核苷酸的互补序列的延伸产物的酶。在一些实施例中,聚合酶是能够在LNA修饰的寡核苷酸序列诸如LNA硫代磷酸酯寡核苷酸序列上逆转录的酶。在一些实施例中,修饰的寡核苷酸包含通过硫代磷酸酯核苷间键合连接的至少两个连续的LNA核苷。在一些实施例中,修饰的寡核苷酸包含通过硫代磷酸酯核苷间键合连接的至少两个连续的糖修饰的核苷。在一些实施例中,修饰的寡核苷酸包含通过硫代磷酸酯核苷间键合连接的至少两个连续的糖修饰的核苷,其中糖修饰的核苷中的至少一个是LNA核苷。在一些实施例中,修饰的寡核苷酸包含至少两个通过硫代磷酸酯核苷间键合连接的连续的2'-O-甲氧基乙基核苷。在一些实施例中,修饰的寡核苷酸包含通过硫代磷酸酯核苷间键合连接的至少两个连续的糖修饰的核苷,其中糖修饰的核苷中的至少一个是LNA核苷,另一个是2'-O-甲氧基乙基核苷。在一些实施例中,修饰的寡核苷酸包含DNA核苷和LNA核苷。

如示例中所示,修饰的寡核苷酸诸如硫代磷酸酯和2'糖修饰的寡核苷酸诸如2'-O-MOE或LNA寡核苷酸对聚合酶构成相当大的障碍。通过筛选许多不同的DNA聚合酶(包括逆转录酶),发明人已经确定Volcano2G聚合酶在利用修饰的寡核苷酸用于作为DNA延伸的模板方面非常有效。发明人还已经确定,在聚乙二醇和/或丙二醇的存在下使用时,Taq聚合酶也是有效的。实施例中使用的小滴PCR方法可用于鉴定其他同样可用于本发明的方法中的合适的聚合酶和酶条件。

Volcano2G聚合酶可从myPOLS Biotec GmbH(DE)获得。

在一些实施例中,本发明方法中使用的聚合酶是基于野生型水生栖热菌(Taq)DNA聚合酶的DNA聚合酶,其包含关于野生型Taq氨基酸序列的突变S515R、I638F和M747K。Taq聚合酶的氨基酸序列作为SEQ ID NO 1提供。在一些实施例中,聚合酶选自由以下组成的组:

(SEQ ID NO:1)或与其具有至少70%同一性,诸如至少80%同一性,诸如至少90%同一性,诸如至少95%同一性,诸如至少98%同一性的有效聚合酶。可以使用实施例中提供的方法(例如通过小滴PCR)来确定有效的DNA聚合酶。

>sp|P19821|DPO1_THEAQ DNA聚合酶I,热稳定的OS=水生栖热菌(Thermusaquaticus)OX=271 GN=polA PE=1 SV=1

MRGMLPLFEPKGRVLLVDGHHLAYRTFHALKGLTTSRGEPVQAVYGFAKSLLKALKEDGDAVIVVFDAKAPSFRHEAYGGYKAGRAPTPEDFPRQLALIKELVDLLGLARLEVPGYEADDVLASLAKKAEKEGYEVRILTADKDLYQLLSDRIHVLHPEGYLITPAWLWEKYGLRPDQWADYRALTGDESDNLPGVKGIGEKTARKLLEEWGSLEALLKNLDRLKPAIREKILAHMDDLKLSWDLAKVRTDLPLEVDFAKRREPDRERLRAFLERLEFGSLLHEFGLLESPKALEEAPWPPPEGAFVGFVLSRKEPMWADLLALAAARGGRVHRAPEPYKALRDLKEARGLLAKDLSVLALREGLGLPPGDDPMLLAYLLDPSNTTPEGVARRYGGEWTEEAGERAALSERLFANLWGRLEGEERLLWLYREVERPLSAVLAHMEATGVRLDVAYLRALSLEVAEEIARLEAEVFRLAGHPFNLNSRDQLERVLFDELGLPAIGKTEKTGKRSTSAAVLEALREAHPIVEKILQYRELTKLKSTYIDPLPDLIHPRTGRLHTRFNQTATATGRLSSSDPNLQNIPVRTPLGQRIRRAFIAEEGWLLVALDYSQIELRVLAHLSGDENLIRVFQEGRDIHTETASWMFGVPREAVDPLMRRAAKTINFGVLYGMSAHRLSQELAIPYEEAQAFIERYFQSFPKVRAWIEKTLEEGRRRGYVETLFGRRRYVPDLEARVKSVREAAERMAFNMPVQGTAADLMKLAMVKLFPRLEEMGARMLLQVHDELVLEAPKERAEAVARLAKEVMEGVYPLAVPLEVEVGIGEDWLSAKE(SEQ ID NO 1)

在一些实施方案中,聚合酶是与具有SEQ ID NO:1的氨基酸序列或其Klenow片段的Taq聚合酶具有至少80%、至少90%、至少95%或至少99%的同一性的DNA聚合酶,其中DNA聚合酶包含在对应于Klenow片段的SEQ ID NO:1所示Taq聚合酶的氨基酸序列的487、508、536、587和/或660位置的一个或多个位置的至少一个氨基酸取代。参见WO2015/082449,在此通过引用并入,包括具体地作为SEQ ID NO 3-24公开的聚合酶。在一些实施例中,DNA聚合酶与SEQ ID NO 1具有至少80%的互补性,诸如与SEQ ID NO 1具有至少90%的互补性,并且包括其中所述一个或多个氨基酸取代选自由SEQ ID NO:1的R487H/V、K508W/Y、R536K/L、R587K/I和R660T/V组成的组。

衔接子探针

如本文所用,术语“衔接子探针”是指寡核苷酸探针,其与来自第一引物的聚合酶介导的5'-3'链延伸的延伸产物的3'端连接。衔接子探针提供了引物结合位点,其可直接用于基于引物的测序,和/或可用于其中包括在本发明的方法中的扩增步骤(PCT步骤)中。衔接子探针可以进一步包含其他区域,诸如测序引物结合位点。衔接子探针可进一步包含用于结合至大规模平行测序中使用的固体支持物的结合位点,诸如流通池结合位点。衔接子探针可进一步包含PCR引物结合位点,以用于扩增步骤(PCR步骤),其中包括在本发明的方法中。

PCR扩增

在一些实施例中,在衔接子探针连接至延伸产物的3'端之后,执行PCR扩增步骤。PCR扩增使用一对PCR引物,其中一条引物对捕获探针上的区域(可能是第一引物结合序列或捕获探针在第一引物结合序列上游的区域)是特异的,并且其他PCR引物对衔接子探针的区域是特异的。

在一些实施例中,诸如在平行测序实施例中,PCR扩增是使用附接于固体表面的引物执行的,诸如珠上扩增或固相桥式扩增。在一些实施例中,固相是流通池(例如,如在固相桥式扩增中所用,例如在Illumina测序平台中所用)。固相桥式扩增中使用的固相PCR也称为簇生成:从衔接子探针的连接获得的产物的文库被捕获在与衔接子探针和/或捕获探针的区域(流通池结合位点)互补的表面结合的寡核苷酸的苔上。然后通过桥式扩增将每个片段扩增成不同的克隆簇。簇生成完成后,模板即可用于边合成边测序。

PCR循环数在一些实施例中可以受到限制,使得每个簇具有约1000个拷贝。在一些实施例中,PCR步骤利用缩短的循环PCR,即PCR循环数限制在2至约25个循环,诸如约10至约20个PCR循环。

条形码

条形码是捕获探针或引物内的序列,其用于鉴定在本发明的方法中获得的序列的原始序列,例如关于鉴定源自相同的捕获探针连接事件(分子条形码)或源自共同的捕获探针连接反应(反应条形码)的多个序列。

分子条形码(例如可用于捕获探针的区域C)

在一些实施例中,捕获探针寡核苷酸和/或衔接子探针包含随机核苷序列的序列(简并序列)。捕获或衔接子探针中简并序列的使用可用于允许鉴定由于PCR扩增步骤后相同的连接的延伸产物分子重复而产生的测序结果。

反应条形码(例如在捕获探针的区域B中使用的条形码)

大规模平行测序的功能使测序模板可以合并到单个测序实验中,从而提高每次测序轮次的成本效益。因此,可期望能够分离测序数据以鉴定源自分离测序模板反应的序列。这可以通过使用捕获探针或PCR引物实现,这些捕获探针或PCR引物包含每个模板唯一的共同序列标识。可以修改反应条形码的长度,以反映合并到每个平行测序轮次中的不同测序模板的复杂性,例如可以是2-20个核苷酸(例如DNA核苷酸长度),诸如4-5个核苷酸长度。

简并核苷酸

简并核苷酸是指核酸序列上的一个位置,该核酸序列在界定位置处可以具有多个替代碱基(如核酸的IUPAC标记所用)。应当认识到的是,对于单个分子,界定位置处将有一个特定的核苷酸,但是在寡核苷酸样本中的分子群体中,界定位置处的核苷酸将是简并的。实际上,简并序列的掺入导致核苷酸序列在寡核苷酸群体的每个成员之间的界定位置处的随机化。已知的是,某些序列可能会在PCR期间优先扩增,因此,通过计算源自简并序列的遗传“条形码序列”的出现,您可以确定扩增前的相对量(参见例如Kielpinski和Vinter,NAR(2014)42(8):e70)。在一些实施例中,捕获探针包含可用于代替简并核苷酸的基于通用的区域(例如肌苷核苷酸)。

测序

测序是指确定核酸分子内核碱基的顺序(序列)。在本发明的上下文中,测序是指确定修饰的寡核苷酸内的核碱基的序列。传统的测序方法基于链终止法(称为Sanger测序),该方法是利用DNA聚合酶在体外DNA复制过程中选择掺入链终止的二脱氧核苷酸,然后对链终止的产物进行电泳分离。通过使用四个独立的反应,每个反应具有不同的链终止碱基(A、T、C或G),通过比较4个链终止反应产物在凝胶电泳中的相对运动性来确定序列。

Sanger测序最初是在掺入放射性标记的核苷酸后进行SDS-PAGE电泳的基础上发展的,并在商业上发展为使用荧光染料标记的引物进行自动DNA测序的基础,例如可以通过毛细管电泳检测。使用染料终止剂测序可以从单一反应混合物(而不是原始Sanger方法的四个反应)进行测序,从而实现自动化。在一些实施例中,本发明方法的测序步骤是使用自动测序执行的。在一些实施例中,本发明方法的测序步骤是使用染料终止剂测序诸如自动染料终止剂测序执行的。

尽管现在仍在使用基于Sanger的测序,但在大规模测序应用中,它已被“下一代”测序技术所取代,参见Goodwin等人,Nature Reviews:Genetics Vol 17(2016),333-351,在此通过引用并入。

基于引物的测序

基于引物的测序是指基于聚合酶与核酸模板杂交的引物由5'-3'的链延伸。基于引物的测序可基于链终止方法(例如,Sanger测序)或有利地使用边合成边测序。

捕获探针/基于衔接子的测序

本发明提供了一种用于对修饰的寡核苷酸或修饰的寡核苷酸群体进行测序的方法。在一些实施例中,该方法包括以下步骤:将捕获探针连接至修饰的寡核苷酸,然后对与捕获探针互补的第一引物进行杂交,随后将其用于基于聚合酶的链延伸以产生延伸产物。然后将衔接子连接至延伸产物的3'端,产生核酸分子,该核酸分子包含5'和3'侧接已知探针序列的修饰的寡核苷酸的互补序列,该互补序列可用作引物结合位点,例如可直接用于基于引物的测序(单分子模板测序)中,也可以在测序前进行扩增,例如经由PCR或缩减循环扩增(克隆扩增测序)。

在一些实施例中,测序步骤是使用“边合成边测序”方法执行的。

边合成边测序

传统的基于Sanger的测序是基于链终止的,而边合成边测序是基于链延伸期间染料标记的核苷酸的添加而不启动链终止。通过实时监视独特的染料信号(A、T、C和G四个碱基中的每个对应一个),可以在链延伸过程中捕获序列。边合成边测序方法的一个显著优势是,它允许对核酸序列的复杂混合物进行大规模平行测序。在一些实施例中,在本发明的方法中使用的测序方法是循环可逆终止方法或单核苷酸添加方法。

边合成边测序方法通常基于循环可逆终止(CRT)或单核苷酸加成(SNA)方法(Metzker,M.L.Sequencing technologies—the next generation.Nat.Rev.Genet.11,31–46(2010):

循环可逆终止(CRT)方法,如Illumina NGS平台和Qiagen IntelligentBioSystems/GeneReader平台所用,使用可逆终止分子,其中核糖3'-OH基团被封闭,从而防止延伸。首先,DNA模板由与衔接子区域互补的序列引发,该序列将引发聚合酶与该双链DNA(dsDNA)区域的结合。在每个循环中,加入所有四个分别标记的且经3'-封闭的脱氧核苷酸(dNTP)的混合物。将单个dNTP掺入每条延伸的互补链中后,去除未结合的dNTP,并对其表面进行成像,以鉴定每个簇处掺入的dNTP。然后可以除去荧光团和保护基团,并且可以开始新的循环。

如本文实例中所用,Illumina系统采用克隆桥式扩增。在一些实施例中,用于本发明的方法的测序方法是克隆桥式扩增。

单核苷酸添加方法,如454焦磷酸测序系统(Roche)和Ion Torrent NGS系统所用,依赖于单个信号来标记dNTP向延伸链中的掺入。结果,必须将四个核苷酸中的每一个迭代地添加到测序反应中,以确保仅一个dNTP对应该信号。此外,这不需要封闭dNTP,因为测序反应中下一个核苷酸不存在的情况会阻止延伸。例外的是添加相同dNTP的均聚物区域,序列鉴定依靠的是信号随着多个dNTP掺入的按比例增加。值得注意的是,Ion Torrent系统不使用荧光核苷酸,而是检测掺入每个dNTP时释放的H+离子。由此产生的pH值的变化可以通过集成的互补金属氧化物半导体(CMOS)和离子敏感场效应晶体管(ISFET)检测。

平行测序

在传统的Sanger测序中,每个测序轮次都用于确定单个核酸模板的序列,而采用下一代测序方法可对核酸序列的异质混合物进行平行测序。如本文所述,平行测序可以采用克隆扩增步骤,并且通过在扩增引物中掺入基于序列的标识符,可以鉴定源自每个原始模板分子的重复克隆序列。

虽然大规模平行测序的开发主要是为了实现包括整个染色体和基因组的长多核苷酸序列的快速和高效测序,实现单个基因分型解决方案,但本发明人已经发现,这些解决方案也提供了独特的机会以鉴定单个分子种类在修饰的寡核苷酸群体中的存在和比较单个分子种类在修饰的寡核苷酸群体中的丰度。这样的方法可用于多种应用中,诸如寡核苷酸治疗药物发现、制造和质量保证、治疗药物开发以及患者监测。

具体实施方式

本发明提供了一种用于对修饰的寡核苷酸的核碱基序列进行测序的方法,所述方法包括以下步骤:

a.将捕获探针寡核苷酸连接至修饰的寡核苷酸的3'末端;

b.从捕获探针进行聚合酶介导的5'-3'第一链合成,以产生包含修饰的寡核苷酸的互补序列的核酸序列;

c.将衔接子探针连接至步骤b中获得的第一链合成产物的3'端;以及随后

-对步骤c)中获得的连接产物进行基于引物的测序;或者

-对步骤c)中获得的连接产物进行PCR扩增,并对PCR扩增产物进行基于引物的测序。

本发明提供了一种用于对修饰的寡核苷酸的群体的碱基序列进行平行测序的方法,所述方法包括以下步骤:

a.将捕获探针寡核苷酸连接至修饰的寡核苷酸群体中存在的修饰的寡核苷酸的3'末端;

b.从捕获探针进行聚合酶介导的5'-3'第一链合成,以产生核酸序列群体,每个核酸序列都包含修饰的寡核苷酸群体中存在的修饰的寡核苷酸的碱基序列的互补序列;

c.将衔接子探针连接至步骤b中获得的第一链合成产物的3'端;以及随后

-对步骤c)中获得的所述连接产物进行基于引物的平行测序;或者

-对步骤c)中获得的连接产物进行PCR扩增,并对PCR扩增产物进行基于引物的平行测序。

本发明提供了一种用于对修饰的寡核苷酸的核碱基序列进行测序的方法,所述方法包括以下步骤:

(i)将捕获探针寡核苷酸连接至修饰的寡核苷酸的3'末端;

(ii)添加与捕获探针寡核苷酸的区域互补的第一引物;

(iii)对第一引物执行聚合酶介导的5'-3'链延伸,

(iv)将衔接子探针连接到步骤iv)中获得的延伸产物的3'端;

(v)对步骤iv)中获得的连接产物进行基于引物的测序。

本发明提供了一种用于对修饰的寡核苷酸的核碱基序列进行测序的方法,所述方法包括以下步骤:

(i)将捕获探针寡核苷酸连接至修饰的寡核苷酸的3'末端;

(ii)添加与捕获探针寡核苷酸的区域互补的第一引物;

(iii)对第一引物执行聚合酶介导的5'-3'链延伸,

(iv)将衔接子探针连接到步骤iii中获得的延伸产物的3'端;

(v)使用一对PCR引物对步骤iv)的连接产物执行PCR扩增,该对PCR引物中的一条引物对捕获探针寡核苷酸是特异的,另一条引物对衔接子探针是特异的。

(vi)对步骤v)中获得的PCR产物执行基于引物的测序。

本发明提供了一种用于对修饰的寡核苷酸的群体的碱基序列进行平行测序的方法,所述方法包括以下步骤:

(i)将捕获探针寡核苷酸连接至修饰的寡核苷酸群体中存在的修饰的寡核苷酸的3'末端;

(ii)添加与捕获探针寡核苷酸的区域互补的第一引物;

(iii)对引物执行聚合酶介导的5'-3'链延伸,

(iv)将衔接子探针连接到步骤iii中获得的延伸产物的3'端;

(v)任选地,使用一对PCR引物对步骤iv)的连接产物执行PCR扩增,该对PCR引物中的一条引物对捕获探针寡核苷酸是特异的,另一条引物对衔接子探针是特异的。

(vi)对步骤iv)中获得的连接产物或步骤v)中获得的PCR产物执行基于引物的平行测序。

本发明提供了一种用于对修饰的寡核苷酸的核碱基序列进行测序的方法,所述方法包括以下步骤:

(i)将自引发捕获探针寡核苷酸连接至修饰的寡核苷酸的3'末端,其中所述自引发捕获探针包含可裂解键合,其在裂解时为5'-3'聚合酶介导的链延伸提供底物;

(ii)裂解自引发捕获探针;

(iii)从裂解的自引发捕获探针进行聚合酶介导的5'-3'链延伸,

(iv)将衔接子探针连接到步骤iii中获得的延伸产物的3'端;

(v)任选地,使用一对PCR引物对步骤iv)的连接产物执行PCR扩增,该对PCR引物中的一条引物对捕获探针寡核苷酸是特异的,另一条引物对衔接子探针是特异的。

(vi)对步骤iv)中获得的连接产物或步骤v)中获得的PCR产物进行基于引物的测序。

本发明提供了一种用于对修饰的寡核苷酸的群体的碱基序列进行平行测序的方法,所述方法包括以下步骤:

(i)将自引发捕获探针寡核苷酸连接到修饰的寡核苷酸群体中存在的修饰的寡核苷酸的3'末端;其中所述自引发捕获探针包含可裂解键合,其在裂解时为5'-3'聚合酶介导的链延伸提供底物;

(ii)裂解自引发捕获探针;

(iii)从裂解的自引发捕获探针进行聚合酶介导的5'-3'链延伸,

(iv)将衔接子探针连接到步骤iii中获得的延伸产物的3'端;

(v)任选地,使用一对PCR引物对步骤iv)的连接产物执行PCR扩增,该对PCR引物中的一条引物对捕获探针寡核苷酸是特异的,另一条引物对衔接子探针是特异的。

(vi)对步骤v)中获得的连接产物或步骤e)中获得的PCR产物执行基于引物的平行测序。

修饰的寡核苷酸的长度可以例如是至多60个连续核苷酸,诸如至多50个连续核苷酸,诸如至多40个连续核苷酸。在一些实施例中,修饰的寡核苷酸是或包含长度为7-30个核苷酸的硫代磷酸酯寡核苷酸。在一些实施例中,修饰的寡核苷酸是或包含长度为7-30个核苷酸的糖修饰的硫代磷酸酯寡核苷酸。在一些实施例中,修饰的寡核苷酸是长度为7-30个核苷酸的2'糖修饰的硫代磷酸酯寡核苷酸。在一些实施例中,修饰的寡核苷酸是长度为7-30个核苷酸的LNA寡核苷酸。在一些实施例中,修饰的寡核苷酸是长度为7-30个核苷酸的LNA硫代磷酸酯寡核苷酸。在一些实施例中,修饰的寡核苷酸包含一种或多种LNA核苷,或一种或多种2'-O-甲氧基乙基核苷。在一些实施例中,修饰的寡核苷酸的3'末端核苷是LNA核苷。在一些实施例中,修饰的寡核苷酸的3'末端核苷是2'取代的核苷,诸如2'-O-甲氧基乙基或2'-O-甲基核苷。

在一些实施例中,测序步骤是使用边合成边测序方法执行的。

在一些实施例中,链延伸步骤,也称为聚合酶介导的5'-3'第一链合成,是在聚合酶和聚乙二醇(PEG)或丙二醇的存在下进行的。在此类实施例中,聚合酶可以任选地是Taq聚合酶,诸如SEQ ID NO 1所示的Taq聚合酶或与其具有至少70%同一性,诸如至少80%同一性,诸如至少90%同一性,诸如至少95%同一性,诸如至少98%同一性的有效聚合酶。

在一些实施例中,链延伸步骤,也称为聚合酶介导的5'-3'第一链合成,是在聚合酶和平均分子量为100-20000,诸如约2000至约10000,诸如约4000的聚乙二醇(PEG)的存在下执行的。

在一些实施例中,链延伸反应(第一链合成步骤)中的PEG浓度为约2%至约15%(w/v-即PEG的重量/反应体积),诸如约3%至约15%。高于15%仍可导致有效的延伸,但是在小滴PCR系统中,这会导致微滴不稳定。在一些实施例中,PEG的浓度为约2%至约20%,或约3%至30%(w/v)。

在一些实施例中,链延伸反应混合物(第一链合成步骤)中丙二醇的浓度为至少约0.8M,并且可以例如约0.8M至2M,诸如约1M至约1.6M。

如实施例中所示,与添加丙二醇相比,添加PEG可以提供更有效的链延伸/第一链合成。

已经发现使用PEG和/或丙二醇有利于与多种聚合酶一起使用,例如如本文所公开的Taq聚合酶和衍生自Taq聚合酶的聚合酶,例如Volcano2G聚合酶。应当认为,本文公开的测定法将用于鉴定其他聚合酶,并且作为所需的反应条件,其可在修饰的寡核苷酸的整个长度上提供有效的第一链合成。

在一些实施例中,用于5'-3'链延伸(第一链合成步骤)的聚合酶是Taq聚合酶,诸如本文所述的Taq聚合酶或Volcano2G聚合酶。

在一些实施例中,聚合酶是PrimeScript逆转录酶(可从Clontech获得)。

DNA聚合酶/逆转录酶的选择可以通过评估聚合酶通读修饰的寡核苷酸诸如糖修饰的寡核苷酸的相对效率来执行。对于糖修饰的寡核苷酸,这可能取决于寡核苷酸中连续的糖修饰的核苷的长度,并且应当认识到对于重度修饰的寡核苷酸,可能需要除Taq聚合酶以外的酶。DNA聚合酶/逆转录酶的选择还取决于样本的纯度,众所周知的是,某些聚合酶对诸如血液等污染物敏感(参见例如Al-Soud等人,Appl Environ Microbiol.1998 Oct;64(10):3748–3753)。

优选地,DNA聚合酶是Volcano2G DNA聚合酶。

在一些实施例中,使用逆转录酶执行第一链合成(5'-3'链延伸步骤)。在一些实施例中,逆转录酶可以选自由M-MuLV逆转录酶、修饰的M-MuLV逆转录酶、SuperScript

优选地,修饰的寡核苷酸是硫代磷酸酯寡核苷酸。在一些实施例中,修饰的寡核苷酸内至少75%的核苷间键合是硫代磷酸酯核苷间键合,诸如修饰的寡核苷酸内至少90%的核苷间键合是硫代磷酸酯核苷间键合,诸如修饰的寡核苷酸内的所有核苷间键合都是硫代磷酸酯核苷间键合。

在一些实施例中,修饰的寡核苷酸是2'糖修饰的寡核苷酸。在一些实施例中,修饰的寡核苷酸包含至少2'糖修饰的核苷。在一些实施例中,修饰的寡核苷酸包含至少1个或至少2个3'末端糖修饰的核苷,诸如至少1个或至少3'末端LNA核苷或至少1个或至少2个末端2'-O-MOE核苷。在一些实施例中,修饰的核苷包含至少3个2'糖修饰的核苷,诸如4、5、6、7、8、9、10个或更多个2'糖修饰的核苷。在一些实施例中,2'糖修饰的核苷独立地选自LNA核苷和2'取代的糖修饰的核苷,诸如2'-O-MOE核苷。优选地,修饰的寡核苷酸是2'糖修饰的硫代磷酸酯寡核苷酸,诸如LNA修饰的硫代磷酸酯寡核苷酸,其中寡核苷酸内至少75%的核苷间键合是硫代磷酸酯核苷间键合,并且修饰的寡核苷酸内的至少一个核苷是LNA核苷,诸如修饰的寡核苷酸内的核苷中的2、3、4、5、6、7、8、9、10、11或12个是LNA核苷。优选地,修饰的LNA寡核苷酸的3'最末端核苷是糖修饰的核苷,诸如LNA核苷,或者可以是2'取代的核苷,诸如2'-O-MOE核苷。在一些实施例中,修饰的寡核苷酸包含至少两个连续的LNA核苷。

在一些实施例中,修饰的寡核苷酸包含至少一种选自由2'-O-烷基-RNA、2'-O-甲基-RNA、2'-烷氧基-RNA、2'-O-甲氧基乙基-RNA(MOE)、2'-氨基-DNA、2'-氟-RNA和2'-F-ANA核苷组成的组的修饰的核苷。

在一些实施例中,修饰的寡核苷酸包含至少一个2'-O-甲氧基乙基RNA(MOE)核苷。在一些实施例中,修饰的寡核苷酸包含至少一个3'末端2'-O-甲氧基乙基RNA(MOE)核苷和至少一个另外的2'-O-甲氧基乙基RNA(MOE)核苷。

在一些实施例中,修饰的寡核苷酸是2'-O-MOE修饰的硫代磷酸酯寡核苷酸,诸如2'-O-MOE修饰的硫代磷酸酯寡核苷酸,其中寡核苷酸内至少75%的核苷间键合是硫代磷酸酯核苷间键合,并且修饰的寡核苷酸内的至少一个核苷是2'-O-MOE核苷,诸如修饰的寡核苷酸内的核苷中的2、3、4、5、6、7、8、9、10、11或12个是2'-O-MOE核苷。优选地,修饰的2'-O-MOE寡核苷酸中3'最末端核苷是糖修饰的核苷,诸如2'-O-MOE。在一些实施例中,修饰的寡核苷酸包含至少两个连续的2'-O-MOE核苷,诸如至少3、4或5个连续的2'-O-MOE核苷。

在一些实施例中,修饰的寡核苷酸是修饰的寡核苷酸群体,其例如可以来自相同的寡核苷酸合成轮次或来自一组寡核苷酸合成轮次。在寡核苷酸合成或制造期间,每个寡核苷酸合成轮次将包含一个寡核苷酸种类群体,例如所需的寡核苷酸产物以及截短版本,例如所谓的n-1产物。此外,如本文所述,在寡核苷酸种类群体中,由于在合成轮次中使用的单体中的杂质或来自先前偶联循环的合成柱的污染,可能产生具有不同序列的寡核苷酸。因此,重要的是要在序列水平上表征这些杂质的存在。在一些实施例中,修饰的寡核苷酸群体是从一系列合成轮次获得的,其中将每个合成试验的产物合并以形成单个修饰的寡核苷酸的批次,其可以通过本发明的方法进行测试。

在一些实施例中,2'糖修饰的寡核苷酸是2'糖修饰的硫代磷酸酯寡核苷酸。

在一些实施例中,修饰的寡核苷酸包含至少两个连续的2'糖修饰的核苷。

在一些实施例中,修饰的寡核苷酸包含至少一个2'-O-甲氧基乙基RNA(MOE)核苷。

在一些实施例中,修饰的寡核苷酸包含至少两个连续的2'-O-甲氧基乙基RNA(MOE)核苷。

在一些实施例中,修饰的寡核苷酸包含位于修饰的寡核苷酸的3'端的至少一个2'-O-甲氧基乙基RNA(MOE)核苷,诸如位于修饰的寡核苷酸的3'端的至少两个或至少三个连续的2'-O-甲氧基乙基RNA(MOE)核苷。

在一些实施例中,修饰的寡核苷酸包含至少1个LNA核苷。

在一些实施例中,修饰的寡核苷酸包含至少两个连续的LNA核苷酸或至少三个连续的LNA核苷酸。

在一些实施例中,LNA核苷酸位于LNA寡核苷酸的3'端处。

在一些实施例中,修饰的寡核苷酸是LNA硫代磷酸酯寡核苷酸。

在一些实施例中,修饰的寡核苷酸包含LNA核苷和DNA核苷这两者,诸如LNA缺口聚体或LNA混聚体。

在一些实施例中,修饰的寡核苷酸包含至少一个T核苷或至少一个C核苷,诸如至少一个DNA-C或至少一个DNA-T,或至少一个2'-甲氧基乙基(MOE)C核苷或至少一个2'-甲氧基乙基(MOE)T核苷。

在一些实施例中,LNA寡核苷酸包含至少一个LNA-T核苷或至少一个LNA-C核苷。

在一些实施例中,修饰的寡核苷酸包含一个或多个LNA核苷和一个或多个2'取代的核苷,诸如一个或多个2'-O-甲氧基乙基核苷。

在一些实施例中,修饰的寡核苷酸选自由以下项组成的组:2'-O-甲氧基乙基缺口聚体、混合翼缺口聚体、交替侧翼缺口聚体或LNA缺口聚体。

在一些实施例中,修饰的寡核苷酸是混聚体或总聚体。

在一些实施例中,修饰的寡核苷酸包含缀合物基团,诸如GalNAc缀合物。

在一些实施例中,测序步骤使用大规模平行测序。

在一些实施例中,基于引物的测序(本发明方法的PCR步骤)的模板,诸如大规模平行测序,是使用克隆桥式扩增(例如Illumina测序-可逆染料终止子),或克隆emPCR(乳液PCR,例如Roche 454、GS FLX Titanium、Life Technologies SOLiD4、Life TechnologiesIon Proton)执行的。在一些实施例中,使用固相模板步移(例如SOLiD Wildfire、ThermoFisher)执行用于基于引物的测序的模板。

大规模平行测序平台(下一代测序)已可商购-例如,如下表所示(如Wikipedia中所列):

表1

在一些实施例中,在将3'捕获探针与修饰的寡核苷酸连接后,在第一链合成(链延伸)之前,对连接产物进行纯化,例如经由凝胶纯化,或经由未连接的捕获探针的酶促降解。

在一些实施例中,在衔接子探针与第一链合成产物连接后,在PCR或测序步骤之前,对连接产物进行纯化,例如经由凝胶纯化,或经由未连接的捕获探针的酶促降解。

在一些实施例中,对修饰的寡核苷酸/3'捕获探针连接产物进行纯化,例如经由凝胶纯化,或经由未连接的捕获探针的酶促降解。

在一些实施例中,将第一链合成链/衔接子探针连接产物纯化,例如经由凝胶纯化或经由未连接捕获探针的酶促降解。

在一些实施例中,捕获探针或衔接子探针或两者均包含测序引物结合位点。

在一些实施例中,第一引物或衔接子探针或两者均包含测序引物结合位点。

在一些实施例中,该方法包括PCR步骤,在PCR步骤中使用的一个或两个PCR引物包含测序引物结合位点。

在一些实施例中,捕获探针和衔接子探针,或第一引物和衔接子探针,进一步包含流动池结合位点。

在一些实施例中,PCR步骤中使用的PCR引物还包含流通池结合位点。

示例性的修饰的寡核苷酸实施例

修饰的寡核苷酸可以是硫代磷酸酯寡核苷酸。修饰的寡核苷酸可以是硫代磷酸酯糖修饰的寡核苷酸,诸如硫代磷酸酯2'糖修饰的寡核苷酸,诸如LNA硫代磷酸酯寡核苷酸或2'-O-甲氧基乙基(MOE)硫代磷酸酯寡核苷酸。

在一些实施例中,修饰的寡核苷酸是治疗性寡核苷酸。

在一些实施例中,修饰的寡核苷酸包含缀合物部分,诸如N-乙酰半乳糖胺(GalNAc)部分,诸如三价GalNAc部分。

在一些实施例中,修饰的寡核苷酸是LNA寡核苷酸,其包含缀合物部分,诸如N-乙酰半乳糖胺(GalNAc)部分,诸如三价GalNAc部分。

在一些实施例中,一种或多种修饰的寡核苷酸是缺口聚体寡核苷酸,诸如MOE缺口聚体、LNA缺口聚体、混合翼缺口聚体或交替侧翼缺口聚体。在一些实施例中,修饰的寡核苷酸是混聚体寡核苷酸,诸如LNA混聚体寡核苷酸。在一些实施例中,修饰的寡核苷酸是总聚体,诸如MOE总聚体,或LNA总聚体寡核苷酸。

在一些实施例中,修饰的寡核苷酸是糖修饰的寡核苷酸,诸如包含LNA或2'-O-甲氧基乙基修饰的核苷酸,或LNA和2'-O-甲氧基乙基同时修饰的核苷酸的寡核苷酸。

在一些实施例中,修饰的寡核苷酸是LNA硫代磷酸酯寡核苷酸。

在一些实施例中,修饰的寡核苷酸包含LNA核苷和DNA核苷这两者,诸如LNA缺口聚体或LNA混聚体。在一些实施例中,修饰的寡核苷酸包含至少一个β-D-氧基LNA核苷或至少一个(S)cET LNA核苷(6'甲基β-D-氧基LNA)。在一些实施例中,存在于LNA寡核苷酸中的LNA核苷是β-D-氧基LNA核苷或至少一个(S)cET LNA核苷(6'甲基β-D-氧基LNA)。

在一些实施例中,修饰的寡核苷酸包含至少一个糖修饰的T核苷和/或至少一个糖修饰的C残基(包括5个甲基C)。

在一些实施例中,修饰的寡核苷酸包含至少一个LNA-T核苷和/或至少一个LNA-C(包括5-甲基C)核苷。

在一些实施例中,修饰的寡核苷酸包含至少一个2'-O-甲氧基乙基T核苷和/或至少一个2'-O-甲氧基乙基C残基(包括5个甲基C)。寡核苷酸合成中使用的胞嘧啶和胸腺嘧啶亚磷酸酯单体的合成往往是经由共同的中间体-如实例所示,这可能导致C或T亚磷酰胺之间的污染,这是本发明方法能够检测到的问题。

在一些实施例中,核苷修饰的寡核苷酸包含至少一个(诸如1、2、3、4或5个)3'末端修饰的核苷,诸如至少一个(诸如1、2、3、4或5个)LNA或至少一个(诸如1、2、3、4或5个)2'取代的核苷,诸如2'O-MOE。在一些实施例中,核苷修饰的寡核苷酸包含至少一种非末端修饰的核苷,诸如LNA或2'取代的核苷,诸如2'-O-MOE。

在一些实施例中,修饰的寡核苷酸包含一个或多个LNA核苷和一个或多个2'取代的核苷,诸如一个或多个2'-O-甲氧基乙基核苷。

在一些实施例中,修饰的寡核苷酸包含缀合物基团,也称为缀合物部分,诸如GalNAc缀合物。在一些实施例中,缀合物部分位于修饰的寡核苷酸中的末端,诸如3'末端或5'末端,并且可以存在将缀合物基团与寡核苷酸共价连接的核苷或非核苷接头部分。

缀合物部分

在一些实施例中,缀合物部分选自由以下项组成的组:蛋白质,诸如酶、抗体或抗体片段或肽;亲脂性部分,诸如脂质、磷脂、固醇;聚合物,诸如聚乙二醇或聚丙二醇;受体配体;小分子;报告基因分子;以及非核苷类碳水化合物。

在一些实施例中,缀合物部分包含或是碳水化合物、非核苷糖、碳水化合物复合物。在一些实施例中,碳水化合物选自由半乳糖、乳糖、正乙酰半乳糖胺、甘露糖和甘露糖-6-磷酸组成的组。

在一些实施例中,缀合物部分包含或选自由蛋白质、糖蛋白、多肽、肽、抗体、酶和抗体片段组成的组。

在一些实施例中,缀合物部分是亲脂性部分,诸如选自由脂质、磷脂、脂肪酸和固醇组成的组的部分。

在一些实施例中,缀合物部分选自由小分子药物、毒素、报告基因分子和受体配体组成的组。

在一些实施例中,缀合物部分是聚合物,诸如聚乙二醇(PEG)、聚丙二醇。

在一些实施例中,缀合物部分是或包含脱唾液酸糖蛋白受体靶向部分,其可以包括例如半乳糖、半乳糖胺、N-甲酰基-半乳糖胺、N-乙酰基半乳糖胺、N-丙酰基-半乳糖胺、N-n-丁酰基-半乳糖胺和N-异丁酰基半乳糖-胺。在一些实施例中,缀合物部分包含半乳糖簇,诸如N-乙酰基半乳糖胺三聚体。在一些实施例中,缀合物部分包含GalNAc(N-乙酰基半乳糖胺),诸如一价、二价、三价或四价GalNAc。三价GalNAc缀合物可用于将化合物靶向肝脏(参见例如US 5,994517和Hangeland等人,Bioconjug Chem.1995Nov-Dec;6(6):695-701、WO2009/126933、WO2012/089352、WO2012/083046、WO2014/118267、WO2014/179620和WO2014/179445)。

缀合物接头

键合或接头是两个原子之间的连接,其经由一个或多个共价键将一个目标化学基团或区段与另一个目标化学基团或区段链接。缀合物部分可直接或通过链接部分(例如接头或系链)附接至寡核苷酸。接头用于共价连接第三区域,例如寡核苷酸的缀合物部分(例如区域A或C的末端)。

在本发明的一些实施例中,本发明的缀合物或寡核苷酸缀合物可任选地包含位于寡核苷酸和缀合物部分之间的接头区域。在一些实施例中,缀合物和寡核苷酸之间的接头是可生物裂解的。

包含生理上不稳定的键或由其组成的可生物裂解的接头,该键在哺乳动物体内通常遇到的条件下或与之相似的条件下可裂解。生理上不稳定的接头经历化学转化(例如裂解)的条件包括化学条件,诸如pH、温度、氧化或还原条件或试剂,以及在哺乳动物细胞中遇到的盐浓度或与之相似的盐浓度。哺乳动物细胞内条件还包括通常存在于哺乳动物细胞中的酶活性,诸如来自蛋白水解酶或水解酶或核酸酶的酶活性。在一个实施例中,可生物裂解的接头对S1核酸酶裂解敏感。在一个优选的实施例中,对核酸酶敏感的接头包含1至10个核苷,诸如1、2、3、4、5、6、7、8、9或10个核苷,更优选地包含2至6个核苷,最优选地包含包含2至4个链接的核苷,该核苷包含至少两个连续的磷酸二酯键合,诸如至少3或4或5个连续的磷酸二酯键合。优选地,核苷是DNA或RNA。包含磷酸二酯的可生物裂解的接头详细描述于WO2014/076195(此处通过引用并入)中。

缀合物也可以经由不可生物裂解的接头与寡核苷酸链接,或者在一些实施例中,缀合物可以包含不可裂解的接头,其共价附接至可生物裂解的接头。不一定是可生物裂解的但主要用于将缀合部分共价连接至寡核苷酸或可生物裂解的接头的接头。此类接头可以包含重复结构诸如乙二醇、氨基酸单元或氨基烷基的链结构或寡聚物。在一些实施例中,接头(区域Y)是氨基烷基,诸如C

质量保证申请

本发明提供了一种用于确定来自相同的修饰的寡核苷酸合成轮次中修饰的寡核苷酸群体中序列异质性的方法,所述方法包括以下步骤:

获得或合成修饰的寡核苷酸,

执行根据本发明的基于引物的测序方法

分析获得的序列数据,以鉴定修饰的寡核苷酸群体的序列异质性。

序列异质性是指鉴定群体内各个种类的序列,例如形成至少0.01%的种类,例如至少0.05%的种类,例如至少0.1%的种类,例如至少0.5%的种类,并根据每个序列的出现情况,任选地鉴定每个种类形成的总群体的比例(唯一序列)。

本发明提供了一种用于验证修饰的寡核苷酸的序列的方法,所述方法包括以下步骤:

获得或合成修饰的寡核苷酸

执行根据本发明的基于引物的测序方法

分析获得的序列数据以验证修饰的寡核苷酸的序列。

本发明提供了一种用于验证修饰的寡核苷酸的群体中的主要序列的方法,所述方法包括以下步骤:

获得或合成修饰的寡核苷酸

执行根据本发明的基于引物的测序方法

分析获得的序列数据以验证修饰的寡核苷酸的序列。

修饰的寡核苷酸群体可以例如来自相同的测序轮次(批次)或一组测序轮次(批次)。

验证可用于识别进入修饰的寡核苷酸合成步骤的不正确输入错误,例如,这可能是由于印刷错误或合成方法步骤中的错误或使用的污染物引起的。或者,验证可用于确认修饰的寡核苷酸的身份,例如,修饰的寡核苷酸可从已施用该修饰的寡核苷酸(例如以治疗药物的形式)的患者中获得。序列验证可以鉴定不正确的序列或截短的寡核苷酸或延长的寡核苷酸或异常合成产物。

本发明提供了一种用于确定修饰的寡核苷酸的纯度的方法

获得或合成修饰的寡核苷酸

执行根据本发明的基于引物的测序方法

分析获得的序列数据,以确定修饰的寡核苷酸的纯度。

本发明提供了大规模平行测序用于对修饰的寡核苷酸群体的核碱基序列进行测序的用途,该修饰的寡核苷酸群体诸如硫代磷酸酯寡核苷酸或糖修饰的寡核苷酸,诸如糖修饰的硫代磷酸酯寡核苷酸,诸如由LNA和/或2'-O-甲氧基乙基修饰的核苷组成的硫代磷酸酯寡核苷酸。

本发明提供了大规模平行测序用于对治疗性寡核苷酸的核碱基序列进行测序的用途,该治疗性寡核苷酸诸如修饰的寡核苷酸群体,诸如硫代磷酸酯寡核苷酸或糖修饰的寡核苷酸,诸如糖修饰的硫代磷酸酯寡核苷酸,诸如包含LNA和/或2'-O-甲氧基乙基修饰的核苷的硫代磷酸酯寡核苷酸。

本发明提供了边合成边测序用于对修饰的寡核苷酸群体的核碱基序列进行测序的用途,该修饰的寡核苷酸群体诸如硫代磷酸酯寡核苷酸或糖修饰的寡核苷酸,诸如糖修饰的硫代磷酸酯寡核苷酸,诸如包含LNA和/或2'-O-甲氧基乙基修饰的核苷的硫代磷酸酯寡核苷酸。

本发明提供了基于引物的聚合酶测序用于确定修饰的寡核苷酸的合成或制造轮次的产物的质量的用途,该修饰的寡核苷酸诸如硫代磷酸酯寡核苷酸或糖修饰的寡核苷酸,诸如糖修饰的硫代磷酸酯寡核苷酸,诸如包含LNA和/或2'-O-甲氧基乙基修饰的核苷的硫代磷酸酯寡核苷酸。

本发明提供了基于引物的聚合酶测序用于确定修饰的寡核苷酸的合成或制造轮次的产物的异质性的用途,该修饰的寡核苷酸诸如硫代磷酸酯寡核苷酸或糖修饰的寡核苷酸,诸如糖修饰的硫代磷酸酯寡核苷酸,诸如包含LNA和/或2'-O-甲氧基乙基修饰的核苷的硫代磷酸酯寡核苷酸。

本发明提供了大规模平行测序用于确定修饰的寡核苷酸的合成或制造轮次的产物的质量的用途,该修饰的寡核苷酸诸如硫代磷酸酯寡核苷酸或糖修饰的寡核苷酸,诸如糖修饰的硫代磷酸酯寡核苷酸,诸如包含LNA和/或2'-O-甲氧基乙基修饰的核苷的硫代磷酸酯寡核苷酸。

本发明提供了边合成边测序用于确定修饰的寡核苷酸的合成或制造轮次的产物的异质性的用途,该修饰的寡核苷酸诸如硫代磷酸酯寡核苷酸或糖修饰的寡核苷酸,诸如糖修饰的硫代磷酸酯寡核苷酸,诸如包含LNA和/或2'-O-甲氧基乙基修饰的核苷的硫代磷酸酯寡核苷酸。

本发明提供了边合成边测序用于确定修饰的寡核苷酸的合成或制造轮次的产物的质量的用途,该修饰的寡核苷酸诸如硫代磷酸酯寡核苷酸或糖修饰的寡核苷酸,诸如糖修饰的硫代磷酸酯寡核苷酸,诸如包含LNA和/或2'-O-甲氧基乙基修饰的核苷的硫代磷酸酯寡核苷酸。

本发明提供了边合成边测序用于确定修饰的寡核苷酸的合成或制造轮次的产物的异质性的用途,该修饰的寡核苷酸诸如硫代磷酸酯寡核苷酸或糖修饰的寡核苷酸,诸如糖修饰的硫代磷酸酯寡核苷酸,诸如包含LNA和/或2'-O-甲氧基乙基修饰的核苷的硫代磷酸酯寡核苷酸。

在一些实施例中,本发明的方法用于确定修饰的寡核苷酸群体中纯度或异质性的程度,该修饰的寡核苷酸群体为例如单个寡核苷酸合成批次或多个寡核苷酸合成批次的合并池。

在一些实施例中,本发明的方法用于确定修饰的寡核苷酸的序列,或修饰的寡核苷酸群体中存在的主要序列,该修饰的寡核苷酸群体为例如单个寡核苷酸合成批次或多个寡核苷酸合成批次的合并池。

实施例:以下实施例可以与专利说明书中描述的本发明的方面组合:

1.一种用于对2'糖修饰的硫代磷酸酯修饰的寡核苷酸的核碱基序列进行测序的方法,所述方法包括以下步骤:

a.将捕获探针寡核苷酸连接至所述修饰的寡核苷酸的3'末端;

b.从所述捕获探针进行聚合酶介导的5'-3'第一链合成,以产生包含所述修饰的寡核苷酸的互补序列的核酸序列;

c.将衔接子探针连接至步骤b中获得的所述第一链合成产物的3'端;以及随后

-对步骤c)中获得的所述连接产物进行基于引物的测序;或者

-对步骤c)中获得的所述连接产物进行PCR扩增并且对PCR扩增产物进行基于引物的测序。

2.一种用于对2'糖修饰的硫代磷酸酯修饰的寡核苷酸群体的碱基序列进行平行测序的方法,所述方法包括以下步骤:

a.将捕获探针寡核苷酸连接至修饰的寡核苷酸群体中存在的修饰的寡核苷酸的3'末端;

b.从所述捕获探针进行聚合酶介导的5'-3'第一链合成,以产生核酸序列群体,每个核酸序列都包含所述修饰的寡核苷酸群体中存在的修饰的寡核苷酸的碱基序列的互补序列;

c.将衔接子探针连接至步骤b中获得的所述第一链合成产物的3'端;以及随后

-对步骤c)中获得的所述连接产物进行基于引物的平行测序;或者

-对步骤c)中获得的连接产物进行PCR扩增,并对PCR扩增产物进行基于引物的平行测序。

3.根据实施例1或2所述的方法,所述捕获探针包含第一引物结合位点,并且在第一链合成之前,将第一引物与所述捕获探针杂交以引发第一链合成。

4.根据实施例1或2所述的方法,所述捕获探针是自引发捕获探针。

5.根据实施例1-4中任一项所述的方法,所述捕获探针和所述衔接子探针包含克隆扩增引物结合位点,并且所述测序步骤包括对步骤c中获得的所述连接产物或对所述PCR扩增产物的克隆扩增。

6.根据实施例1-5中任一项所述的方法,所述PCR扩增步骤使用一对PCR引物进行,所述一对PCR引物中的一条引物对所述捕获探针寡核苷酸是特异的,另一条引物对所述衔接子探针是特异的。

7.根据实施例6所述的方法,所述PCR扩增引物包含克隆扩增引物结合位点,并且所述基于引物的测序步骤包括对所述PCR扩增产物的克隆扩增。

8.根据实施例1-5中任一项所述的方法,所述克隆扩增引物对所述第一和第二PCR引物是特异的;或所述克隆扩增引物对所述3'捕获探针和衔接子探针是特异的;或分别地所述克隆扩增引物中的一条引物对所述PCR引物中的一条引物是特异的,而另一克隆扩增引物对所述3'捕获探针或所述衔接子探针是特异的。

9.根据实施例1-8中任一项所述的方法,所述基于引物的测序步骤使用边合成边测序方法进行。

10.根据实施例1-9中任一项所述的方法,所述基于引物的测序方法是循环可逆终止方法(CRT)。

11.根据实施例1-10中任一项所述的方法,所述测序步骤包括克隆扩增,并且所述克隆扩增引物与固体支持物例如流动池结合,或在乳化小滴内区室化。

12.根据实施例1-11中任一项所述的方法,所述基于引物的测序步骤的所述PCR步骤包括:

a.固相扩增,例如固相桥式扩增,或

b.乳化相扩增,例如小滴PCR。

13.根据实施例1-12中任一项所述的方法,所述基于引物的测序使用平行测序例如大规模平行测序来进行。

14.根据实施例1-13中任一项所述的方法,所述第一链合成是在聚合酶和聚乙二醇或丙二醇的存在下进行的。

15.根据实施例1-14中任一项所述的方法,用于第一链合成的所述聚合酶是Taq聚合酶或Volcano2G聚合酶或PrimeScript逆转录酶或与Taq聚合酶具有至少70%同一性的有效聚合酶。

16.根据实施例1-15中任一项所述的方法,所述修饰的寡核苷酸是2'糖修饰的硫代磷酸酯寡核苷酸,诸如LNA硫代磷酸酯或2'-O-MOE硫代磷酸酯寡核苷酸。

17.根据实施例1-16中任一项所述的方法,所述修饰的寡核苷酸包含至少两个连续的2'糖修饰的核苷。

18.根据实施例1-17中任一项所述的方法,所述修饰的寡核苷酸包含至少一个2'-O-甲氧基乙基RNA(MOE)核苷。

19.根据实施例1-18中任一项所述的方法,所述修饰的寡核苷酸包含至少两个连续的2'-O-甲氧基乙基RNA(MOE)核苷。

20.根据实施例1-19中任一项所述的方法,所述修饰的寡核苷酸包含位于所述修饰的寡核苷酸的3'端的至少一个2'-O-甲氧基乙基RNA(MOE)核苷,诸如位于所述修饰的寡核苷酸的3'端的至少两个或至少三个连续的2'-O-甲氧基乙基RNA(MOE)核苷。

21.根据实施例1-20中任一项所述的方法,所述修饰的寡核苷酸包含至少1个LNA核苷。

22.根据实施例1-21中任一项所述的方法,所述修饰的寡核苷酸包含至少两个连续的LNA核苷酸或至少三个连续的LNA核苷酸。

23.根据实施例1-22所述的方法,所述修饰的寡核苷酸包含至少一个LNA核苷酸,诸如位于所述LNA寡核苷酸的3'端的至少两个LNA核苷酸。

24.根据实施例1-23中任一项所述的方法,所述修饰的寡核苷酸是LNA硫代磷酸酯寡核苷酸。

25.根据实施例1-24中任一项所述的方法,所述修饰的寡核苷酸包含LNA核苷和DNA核苷这两者,诸如LNA缺口聚体或LNA混聚体。

26.根据实施例1-25中任一项所述的方法,所述修饰的寡核苷酸包含至少一个2'糖修饰的T核苷,诸如LNA-T核苷,或至少一个2'糖修饰的C核苷,诸如LNA-C核苷。

27.根据实施例1-26中任一项所述的方法,所述修饰的寡核苷酸包含一个或多个LNA核苷和一个或多个2'取代的核苷,诸如一个或多个2'-O-甲氧基乙基核苷。

28.根据实施例1-27中任一项所述的方法,所述修饰的寡核苷酸选自由以下项组成的组:2'-O-甲氧基乙基缺口聚体、混合翼缺口聚体、交替侧翼缺口聚体或LNA缺口聚体。

29.根据实施例1-27中任一项所述的方法,所述修饰的寡核苷酸是混聚体或总聚体。

30.根据实施例1-29中任一项所述的方法,所述修饰的寡核苷酸包含缀合物基团,诸如GalNAc缀合物。

31.根据实施例1-30中任一项所述的方法,所述方法用于确定修饰的寡核苷酸群体中纯度或异质性的程度,所述修饰的寡核苷酸群体为例如单个寡核苷酸合成批次或多个寡核苷酸合成批次的合并池。

32.根据实施例1-31中任一项所述的方法,所述方法用于确定所述修饰的寡核苷酸的所述序列,或所述修饰的寡核苷酸群体中存在的主要序列,所述修饰的寡核苷酸群体为例如修饰的寡核苷酸合成批次或多个寡核苷酸合成批次的合并池。

33.根据实施例1-32中任一项所述的方法,所述修饰的寡核苷酸是修饰的寡核苷酸群体,例如来自同一寡核苷酸合成轮次[或批次]或多个寡核苷酸合成轮次[或批次]的修饰的寡核苷酸群体的合并池。

34.基于引物的测序用于对2'糖修饰的寡核苷酸群体的核碱基序列进行测序的用途。

35.基于引物的测序用于确定2'糖修饰的寡核苷酸的合成或制造轮次的产物的异质性的用途。

36.基于引物的测序用于确定2'糖修饰的寡核苷酸的合成或制造轮次的产物的质量的用途。

37.平行测序用于对2'糖修饰的寡核苷酸群体的核碱基序列进行测序的用途。

38.平行测序用于确定2'糖修饰的寡核苷酸的合成或制造轮次的产物的质量的用途。

39.平行测序用于确定2'糖修饰的寡核苷酸的合成或制造轮次的产物的异质性的用途。

40.边合成边测序用于对2'糖修饰的寡核苷酸群体的核碱基序列进行测序的用途。

41.边合成边测序用于确定2'糖修饰的寡核苷酸的合成或制造轮次的产物的异质性的用途。

42.边合成边测序用于确定2'糖修饰的寡核苷酸的合成或制造轮次中产物的质量的用途。

43.根据实施例34-42中任一项所述的用途,所述2'糖修饰的寡核苷酸如实施例1-33中任一项所定义。

44.Taq聚合酶或与SEQ ID NO 1具有至少70%同一性的聚合酶的用途,用于从包含LNA修饰的硫代磷酸酯寡核苷酸或2'-O-甲氧基乙基修饰的硫代磷酸酯寡核苷酸的模板进行第一链合成。

实例

为了能够对核苷修饰的寡核苷酸(例如LNA寡核苷酸)进行测序,我们需要一种能够有效读取整个LNA寡核苷酸的聚合酶。我们确定只有某些聚合酶才能做到这一点,而对于某些聚合酶,某些添加剂的存在可以增强核苷修饰的寡核苷酸的通读功效。在此我们确定了优选的聚合酶,并已发现使聚合酶能够读取整个测试LNA寡核苷酸的用于PCR反应的添加剂。

实例1:生成测试分子以测试LNA寡核苷酸的聚合酶读取效率。

为了能够测试各种聚合酶读取LNA寡核苷酸的能力,我们生成了一个单链测试模板分子,其中一个具有硫代磷酸酯主链(12个碱基对)的LNA寡核苷酸在>20bp的常规DNA碱基的5'和3'侧上均侧接硫代磷酸酯主链(参见图1A),命名为“LNA测试模板1”(LTT1)。该模板分子用于以后的各种实验。我们还与此LNA寡核苷酸测试分子平行生成了相同的测试模板,其中12个碱基对由相同序列组成,但所有碱基的DNA和主链均为磷酸二酯。该模板称为“DNA测试模板1”(DTT1),用作对照寡核苷酸。这些模板用于以后的实验中,引物置于这些分子的5'端和3'部分。为了进行PCR反应,聚合酶必须能够将引物一直延伸跨越模板包含磷酸二酯主链以及5'常规DNA的部分。因此,该LTT1分子用于测试聚合酶复制LNA寡核苷酸的能力。

LTT1和DTT1生成如下:

以下寡核苷酸为合成(LNA O1)或从IDT(DNA O1)订购。

LNA O1:5'-g

DNA O1:5'-g

其中小写字母是DNA核苷,大写字母是β-D-氧基LNA核苷,

将这些寡核苷酸连接至以下DNA捕获探针(DCP1)

/5Phos/CGGACCAGCAAGCTTAGAGATCACGGTATCCAGATTCGCTCATAGTACACAACTGCC/iSp18/TCCGGTTCAA/3AmMO/(SEQ ID NO 4)

(所有核苷均为磷酸二酯连接的DNA核苷;“/5Phos/”表示5'磷酸基团;/iSp18/表示18原子的六乙二醇间隔基;/3AmMO/表示3'氨基修饰)。请注意,在序列表中,本文公开的探针的碱基序列提供时未包含指定的修饰,在某些情况下,RNA碱基显示为DNA碱基-在不一致的情况下,实例中的序列和序列的修饰优先于序列表中的公开。

连接反应:

在PCR管中建立以下连接反应:

a:2ul H2O+2ul DCP1(100uM)

b:2ul LNA O1(10uM)+2uL DCP1(100uM)

c:2ul LNA O1(10uM)+2uL DCP1(100uM)

将混合物在55℃加热3min,然后冷却至4℃。

向每个试管中添加:

2ul T4 DNA连接酶缓冲液(Thermo Scientific)

6ul PEG(50%)

6ul H2O

2ul T4 DNA连接酶(Thermo Scientific)

将混合物涡旋并在以下条件下进行连接3X循环(16℃;20min,25℃;10min,37℃;1min),然后75℃下10min,然后保持在4℃。

凝胶电泳:

向上述每个反应中,加入等体积的2倍

从凝胶上切下含有DCP1和寡核苷酸之间的连接产物的条带。将凝胶碎片压碎并在500ul TE缓冲液中浸泡一整夜,以提取连接的寡核苷酸。浸泡后,使用

LTT1、DTT1和捕获探针(DCP1)在使用QX200

使用DCP1特异性引物(DCP1_primer1:GCAGTTGTGTACTATGAGCGA,SEQ ID NO 5)和结合至LTT1和DTT1的5'端的正向引物(TT1_primer1:GCGTAACTAGACCATAAGCC,SEQ ID NO6)建立PCR反应。还进行了第二反应,其中加入额外的标准Taq聚合酶(New EnglandBiolabs)。这样做是为了查看添加标准Taq是否会提高LTT1的通读。

表2

22uL PCR反应设置:

表3

结果:

图2小图A示出6种不同PCR反应中微滴的荧光强度的一维图。可以清楚地看到,DTT1模板的PCR扩增是可行的,因为出现许多阳性微滴。但是,在使用LTT1或DCP1的PCR反应中,我们没有看到或只看到很少阳性微滴。无论是否额外加入标准Taq聚合酶,看到的都是相同的结果。这说明Taq聚合酶几乎永远无法完整读取整个具有磷酸酯主链的含有LNA的寡核苷酸。

由于Taq聚合酶在常规条件下无法读取整个LTT1模板,因此我们测试了许多可商购的逆转录酶(RT)聚合酶,以了解RT酶是否能够读取LNA寡核苷酸序列。这是通过设置第一链复制反应完成的,其中不同的聚合酶尝试使用DCP1_primer1作为引物复制LTT1。其次;使用如实例2中所述的DCP1_primer1和TT1_primer1在ddPCR反应中测试了完整LTT1第一链拷贝的生成量。图3显示测试以下6种聚合酶的结果:来自Agilent的AccuScript Hi-Fi逆转录酶、来自Thermo Scientific的SuperScript IV逆转录酶200U/ul、来自MyPols的Volcano2GDNA聚合酶5U/ul、来自Thermo Scientific的RevertAid逆转录酶200U/ul、来自NewEngland BioLabs的AMV逆转录酶10 Units/ul、来自Takara的PrimeScript逆转录酶(PrimeScript RT试剂盒)。

10ul第一链合成反应:

包含所有反应(1ul LTT1(31pM)、0.5ul DCP1_primer1(10uM)和水添加10ul)。使用供应商提供的缓冲液运行不同的酶。

a)1ul Accuscript、1ul 0.1M DTT、1ul缓冲液、1ul dNTP(10mM)

b)0.5ul SuperScript IV、0.5ul 0.1M DTT,2ul第一链缓冲液、1ul dNTP(10mM)

c)0.2ul Vulcano2G、2ul Vulcano缓冲液、1ul dNTP(10mM)

d)0.5ul RevertAid、2ul反应缓冲液、1ul dNTP(10mM)

e)0.5ul AMV、0.5ul 0.1M DTT、2ul cDNA合成缓冲液、1ul dNTP(10mM)

f)0.5ul PrimeScript、2ul PrimeScript缓冲液、1ul dNTP(10mM)

加入除了酶之外的所有组分,将混合物加热至65℃持续5min,然后置于冰上1min,然后最终加入RT酶。每种条件下,在以下温度下进行1小时第一链合成(55℃、54.2℃、52.5℃、50℃、47.1℃、44.6℃,42.9℃、42℃)然后在80℃下10min,冷却并保持在4℃。

将所有第一链反应用水稀释200倍,并将2ul样本用作常规QX200

结果:

图3显示不同PCR反应中微滴的荧光强度。图中仅显示42℃RT反应的结果。对于每种条件,其他温度的结果相同,只是在52.5℃以上失去非常小的AMV活性。我们看到,在普通RT酶中,无法读取整个LTT1模板上或者效率非常低。但是,我们发现Vulcano2G在读取模板方面似乎具有相当高的效率。与DTT1模板上具有相等输入分子数量的ddPCR相比,微滴数量的定量显示,Vulcano2G酶的读取效率约为10%,这意味着10个LLT1分子中的一个被Vulcano2G酶完整转录。我们发现AMV和Prime Script酶的效率约为0.1%。

为了尝试克服使用聚合酶在LNA寡核苷酸上转录的困难,我们着手测试PCR反应中的添加剂是否可以帮助聚合酶读取LTT1中的LNA寡核苷酸。我们测试了4种已知的PCR添加剂,即四甲基氯化铵(TMA)、聚乙二醇(PEG)、氯化铵和1,2-丙二醇,以了解它们是否会对读取LNA寡核苷酸具有有益的作用。使用含有改良Taq聚合酶的AccuStart II PCR ToughMix(QuantiBio)在乳液PCR反应中测试添加剂。使用用于EvaGreen的自动微滴生成油在AutoDG(BioRad)上产生微滴。PCR循环后,在QX200微滴读取器(BioRad)上读取微滴。将单独的EvaGreen染料(Biotium目录号31000)添加到PCR反应中。

测试了ddPCR反应的以下添加物:TMA(1mM、5mM、10mM、20mM、40mM、60mM、80mM、100mM)、PEG(0%、0.1%、0.5%、1%、2%、3%、4%、5%)、氯化铵(1mM、5mM、10mM、20mM、40mM、60mM、80mM、100mM)、1,2-丙二醇(0.2M、0.4M、0.6M、0.8M、1M、1.2M、1.6M、2M)。

PCR反应混合物(22ul):

11ul AccuStart II PCR ToughMix

0.2ul TT1_primer1(10uM)

0.2ul DCP1_primer1(10uM)

0.5ul EvaGreen染料(40x)

X uL PCR添加剂

2uL LTT1(100fM)

H2O ad 22uL

表4

结果:

图4显示使用添加剂的ddPCR结果。结果显示为一维图,显示所有微滴的荧光强度。结果显示,添加TMA氯化物和氯化铵不会导致LNA通读有任何改善(图4小图A和C)。但是,我们看到PEG浓度增加会导致阳性微滴数量增加。积极作用始于3%PEG,4%和5%均有增加(图4小图B)。我们还观察到添加1,2-丙二醇的积极作用,其中我们看到阳性微滴数量从0.8M 1,2-丙二醇开始增加(图4小图D)。尽管将1,2-丙二醇的浓度增加到1.2M以上确实会产生更多阳性微滴,但也会导致阳性微滴的荧光强度降低。综上所述,我们得出的结论是,添加PEG或1,2-丙二醇可使Taq聚合酶显著提高其读取整个具有磷酸化主链的LNA寡核苷酸的能力。图4小图E显示检测到的LTT1分子的浓度,表明PEG明显提高LTT1的检测率,并且与同样能够增加一定读取LTT1模板的能力的1,2-丙二醇相比,PEG是更好的添加剂。

由于我们没有看到PEG的积极作用达到饱和,因此我们以相同的设置进行了第二次实验,但在其中我们进一步提高了反应中PEG的浓度。(图4小图F)。当PEG的浓度增加到9%以上时,我们开始看到微滴开始瓦解,尽管阳性微滴的数量相同。当PEG的浓度为15%时,我们看到微滴完全瓦解。最后,我们测试了PEG和1,2-丙二醇的组合是否进一步提高了寡核苷酸通读。图4小图G显示使用9%的PEG和0M、0.5M、1.0M或1.5M的1,2-丙二醇的相应ddPCR反应,显示通过共添加1,2-丙二醇以进一步增强反应没有明显的益处。通常,当PEG的量超过6%时,我们看不到在ddPCR反应中添加额外1,2-丙二醇的益处(数据未显示)。

在实例4中表明,当我们使用含有未公开的修饰的Taq聚合酶的Accustart II PCRToughMix(QuantaBio)时,添加PEG和1,2-丙二醇时对于LTT1模板分子的成功扩增是有益的。为了查看PCR添加剂是否还使LNA寡核苷酸能够“通读”其他聚合酶,我们通过执行多轮LTT1模板的第一链合成来测试常规Taq聚合酶和高保真聚合酶(Phusion聚合酶,ThermoScientific)。如实验2、3、4中所示,通过Evagreen ddPCR检测可检测所生成完整的第一链拷贝的数量。设置以下20ul反应,并执行0、1、3、5和10轮第一链扩增。

a)0.1ul Taq聚合酶、2ul Taq缓冲液、0.4ul DCP1_primer1(10uM)、0.4ul LTT1(10pM)

b)0.1ul Taq聚合酶、2ul Taq缓冲液、0.4ul DCP1_primer1(10uM)、0.4ul LTT1(10pM)、0.5ul 1,2-丙二醇、4ul PEG(50%)

c)2ul Taq缓冲液、0.4ul DCP1_primer1(10uM)、0.4ul LTT1(10pM)、0.5ul 1,2-丙二醇、4ul PEG(50%)

d)0.2ul Phusion聚合酶、5倍HF缓冲液、0.4ul DCP1_primer1(10uM)、0.4ul LTT1(10pM)

e)0.2ul Phusion聚合酶、5倍HF缓冲液、0.4ul DCP1_primer1(10uM)、0.4ul LTT1(10pM)、0.5ul 1,2-丙二醇、4ul PEG(50%)

f)0.2ul Phusion聚合酶、5倍GF缓冲液、0.4ul DCP1_primer1(10uM)、0.4ul LTT1(10pM)

g)0.2ul Phusion聚合酶、5倍GF缓冲液、0.4ul DCP1_primer1(10uM)、0.4ul LTT1(10pM)、0.5ul 1.2-丙二醇、4ul PEG(50%)

第一链反应。(95℃下5min;52.5℃下3min循环X次,95℃下30sec;然后置于冰上)

如实例2所述,将第一链合成反应稀释50倍,并将2ul用作Evagreen ddPCR反应的输入。

结果:

图5显示第一链合成ddPCR反应的结果。图5小图A显示在没有PCR添加剂的情况下第一链Taq聚合酶合成上的ddPCR反应。可以看出,由于第一链合成循环,阳性微滴的数量几乎没有增加,再次表明Taq聚合酶在常规条件下无法读取整个含有磷酸酯主链和LNA碱基的寡核苷酸。图5小图C显示没有Taq聚合酶存在的情况下相同的反应。没有Taq聚合物的第一链反应中的阳性微滴数量几乎与没有添加剂的反应中的阳性微滴数量相同。这表明大多数阳性微滴来自发生在Evagreen ddPCR反应期间而不是在第一链合成期间LNA模板的复制。图5小图B显示第一链合成反应期间存在10%PEG和0.31M时ddPCR反应的结果。可以看出,阳性微滴的数量随第一链合成循环次数增加而增加,表明添加剂使标准Taq聚合酶能够读取整个LTT1的LNA寡核苷酸部分。图5小图E和F显示在有和没有10%PEG和0.31M 1.3-丙二醇添加剂的情况下,在HF缓冲液中使用phusion DNA聚合酶进行第一链合成反应的ddPCR。这说明无论是否加入PEG和1,2-丙二醇以及使用缓冲液HF或GF缓冲液,Phusion聚合酶都无法读取整个LTT1的LNA寡核苷酸部分。图5小图D显示在7种测试条件下检测到的LTT1拷贝数的定量。仅在使用Taq聚合酶和添加剂的反应中可以看到LTT1模板分子的有效第一链复制。我们得出的结论是,这些经过测试的PCR添加剂(PEG和1,2-丙烷二醇)的存在可以使某些DNA聚合酶读取整个LNA寡核苷酸。

为了说明可以对具有完整硫代磷酸酯主链的LNA寡核苷酸进行测序,我们使用以下方法对5个LNA寡核苷酸的混合物进行测序。在第一链合成期间使用添加或不添加PEG的常规Taq DNA聚合酶和Vulcano2G聚合酶(myPOLS)进行测序。

将以下LNA寡核苷酸以1:1的比例混合,并稀释至最终浓度为1uM:

LNA混合物:

表5

表6-捕获探针:

捕获探针RT引物:CTATCACGCGACATGCGG(SEQ ID NO 16)

第一连接反应:

将2ul LNA混合物与2ul捕获探针索引1(10uM)混合

将2ul LNA混合物与2ul捕获探针索引2(10uM)混合

将2ul LNA混合物与2ul捕获探针索引3(10uM)混合

将2ul LNA混合物与2ul捕获探针索引4(10uM)混合

然后将混合物加热至55℃,然后冷却至4℃。

向每个试管中加入16ul连接混合物:

每20ul反应:(2ul T4连接缓冲液、6ul PEG、6ul H

向上述每个反应中,加入等体积的2倍

从凝胶上切下含有捕获探针和寡核苷酸之间的连接产物的条带。裂解区域在图6A中以红色框表示。将凝胶碎片压碎并在500ul TE缓冲液中浸泡一整夜,以提取连接的寡核苷酸。浸泡后,使用Amicon Ultra 0.5mL离心式MWCO 3 kDa过滤器将连接的寡核苷酸洗涤并浓缩。最后,使用SpeedVac将样本浓缩至约10ul。

使用4种不同的方案产生连接的LNA寡核苷酸的第一链拷贝。

表7

使用以下程序在热循环仪上执行第一链合成:

95℃;3min 10次(55℃;5min,72℃;1min)然后保持在4℃

使用制造商的寡核苷酸清理方案,使用

将8ul第一链合成反应与2ul捕获探针2(1uM)混合

然后将混合物加热至55℃,然后冷却至4℃。

向每个试管中加入16ul连接混合物:

每20ul反应:(2ul T4连接缓冲液、6ul PEG、6ul H

连接的第一链合成的PCR扩增使用Phusion DNA聚合酶执行,使用NGS_PCR_primer1和2。这些引物包含5'突出端,与Illumina的TruSeq NGS方案兼容。

表8

PCR循环:98℃;30s,15次(98℃;15s,60℃;20s,72℃;20s),72℃下5min然后保持在4℃

根据制造商的说明,在QIAquick PCR纯化试剂盒(Qiagen)上纯化PCR产物,并在30ul H

将4个反应归一化至相同浓度,并合并在一起以创建10nM NGS文库。将phiX对照混合物加标到该样本中,使最终浓度达到总分子的20%,以便为随后的Illumina测序提供序列变异。NGS库是根据Illumina用于MiniSeq系统的变性和稀释文库指南制备的。使用MID输出盒在Illumina miniSeq系统上对文库测序。设置测序以生成仅使用读长1并在没有索引的情况下执行151个循环的fastq文件。

将生成的fastq文件导入到CLC Genomics Workbench 10软件(Qiagen)中。根据不同捕获探针1中置入的条形码将读长分离,并从读长的5'端修剪掉来自捕获探针1的其余读长。随后,将源自捕获探针2的序列从3'端修剪掉,仅留下插入在捕获探针1和2之间的序列。然后使用awk命令行修剪掉所有小于18的读长,最后通过去除测序读长的3端的碱基,将所有大于18bp或32bp的读长修剪成18或32bp。对独特读长的数量进行定量,前10个最频繁的读长显示于图6小图B。在图6中,对读长进行反向补充,以5'->3'的方式读取原始LNA寡核苷酸。

我们在本文中说明,完全磷酸化的LNA寡核苷酸的测序有可能用于QC。

以下LNA寡核苷酸用于测序。

表9-LNA混合物:

表10-捕获探针:

捕获探针1RT引物:CTATCACGCGACATGCGG(SEQ ID NO 16)

将2ul寡核苷酸1与2ul捕获探针1索引3(10uM)混合

将2ul寡核苷酸2与2ul捕获探针1索引2(10uM)混合

将2ul寡核苷酸3与2ul捕获探针1索引4(10uM)混合

将2ul寡核苷酸4与2ul捕获探针1索引1(10uM)混合

然后将混合物加热至55℃,然后冷却至4℃。

向每个试管中加入16ul连接混合物:

每20ul反应:(2ul T4连接缓冲液、6ul PEG、6ul H

向上述每个反应中,加入等体积的2倍

从凝胶上切下含有捕获探针和寡核苷酸之间的连接产物的条带。裂解区域在图1A中以白色框表示。将凝胶碎片压碎并在500ul TE缓冲液中浸泡一整夜,以提取连接的寡核苷酸。浸泡后,使用Amicon Ultra 0.5mL离心式MWCO 3 kDa过滤器将连接的寡核苷酸洗涤并浓缩。最后,使用SpeedVac将样本浓缩至约10ul。

使用Vulcano2G DNA聚合酶在20ul反应中进行第一链合成:

4ul:5倍Vulcano2G缓冲液

0.4ul:Vulcano2G聚合酶

0.5ul:dNTP(10uM)

0.4ul:捕获RT引物(10uM)

4ul:连接模板

H20 ad 20ul

在热循环仪上使用以下程序:

95℃;3min 10次(55℃;5min,72℃;1min)然后保持在4℃

使用制造商的寡核苷酸清理方案,使用

将8ul第一链合成反应与2ul捕获探针2(1uM)混合

然后将混合物加热至55℃,然后冷却至4℃。

向每个试管中加入16ul连接混合物:

每20ul反应:(2ul T4连接缓冲液、6ul PEG、6ul H

连接的第一链合成的PCR扩增使用Phusion DNA聚合酶执行,使用NGS_PCR_primer1和2。这些引物包含5'突出端,与Illumina的TruSeq NGS 方案兼容。

表 11

PCR循环:98℃;30s,15次(98℃;15s,60℃;20s,72℃;20s),72℃下5min然后保持在4℃

根据制造商的说明,在QIAquick PCR纯化试剂盒(Qiagen)上纯化PCR产物,并在30ul H

NGS设置:

将4个反应归一化至相同浓度,并合并在一起以创建10nM NGS文库。将phiX对照混合物加标到该样本中,使最终浓度达到总分子的20%,以便为随后的Illumina测序提供序列变异。NGS库是根据Illumina用于MiniSeq系统的变性和稀释文库指南制备的。使用MID输出盒在Illumina miniSeq系统上对文库测序。设置测序以生成仅使用读长1并在没有索引的情况下执行151个循环的fastq文件。

NGS数据分析:

将生成的fastq文件导入到CLC Genomics Workbench 10软件(Qiagen)中。根据四个捕获探针1'中置入的条形码将读长分离,并从读长的5'端修剪掉来自捕获探针1的其余读长。随后,将源自捕获探针2的序列从3'端修剪掉,仅留下插入在捕获探针1和2之间的序列。然后使用awk命令行修剪掉所有小于18的读长,最后通过去除测序读长的3端的碱基,将所有大于18bp的读长修剪成18bp。对独特读长的数量进行定量,前10个最频繁的读长显示于图8小图B-E。在图8中,对读长进行反向补充,以5'->3'的方式读取原始LNA寡核苷酸。

我们在本文中说明,在5'端与GalNac缀合的完全磷酸化的LNA寡核苷酸的测序有可能用于QC。

以下LNA寡核苷酸用于测序。

LNA混合物:

捕获探针:

捕获探针1RT引物:CTATCACGCGACATGCGG(SEQ ID NO 16)

将2ul寡核苷酸1与2ul捕获探针1索引3(10uM)混合

然后将混合物加热至55℃,然后冷却至4℃。

向试管中加入16ul连接混合物:

每20ul反应:(2ul T4连接缓冲液、6ul PEG、6ul H

向上述反应中,加入等体积的2倍

从凝胶上切下含有捕获探针和寡核苷酸之间的连接产物的条带。将凝胶碎片压碎并在500ul TE缓冲液中浸泡一整夜,以提取连接的寡核苷酸。浸泡后,使用Amicon Ultra0.5mL离心式MWCO 3 kDa过滤器将连接的寡核苷酸洗涤并浓缩。最后,使用SpeedVac将样本浓缩至约10ul。

使用Vulcano2G DNA聚合酶在20ul反应中进行第一链合成:

4ul:5倍Vulcano2G缓冲液

0.4ul:Vulcano2G聚合酶

0.5ul:dNTP(10uM)

0.4ul:捕获RT引物(10uM)

4ul:连接模板

H20 ad 20ul

在热循环仪上使用以下程序:

95℃;3min;10次(55℃;5min,72℃;1min);然后保持在4℃

使用制造商的寡核苷酸清理方案,使用

将8ul第一链合成反应与2ul捕获探针2(1uM)混合

然后将混合物加热至55℃,然后冷却至4℃。

向每个试管中加入16ul连接混合物:

每20ul反应:(2ul T4连接缓冲液、6ul PEG、6ul H

表12

连接的第一链合成的PCR扩增使用Phusion DNA聚合酶执行,使用NGS_PCR_primer1和2。这些引物包含5'突出端,与Illumina的TruSeq NGS方案兼容。

PCR循环:98℃;30s,15次(98℃;15s,60℃;20s,72℃;20s),72℃下5min然后保持在4℃

根据制造商的说明,在QIAquick PCR纯化试剂盒(Qiagen)上纯化PCR产物,并在30ul H

NGS设置:

将反应归一化为10nM,并与另一个包含不同条形码系统的NGS文库合并,以创建10nM NGS文库。该单一反应约占总NGS文库的10%。NGS库是根据Illumina用于MiniSeq系统的变性和稀释文库指南制备的。使用MID输出盒在Illumina miniSeq系统上对文库测序。设置测序以生成仅使用读长1并在没有索引的情况下执行151个循环的fastq文件。

NGS数据分析:

将生成的fastq文件导入到CLC Genomics Workbench 10软件(Qiagen)中。分离源自捕获探针1索引1的读长,并从读长的5'末端修剪掉来自捕获探针1的其余读长。随后,将源自捕获探针2的序列从3'端修剪掉,仅留下插入在捕获探针1和2之间的序列。然后使用awk命令行修剪掉所有小于15的读长,最后通过去除测序读长的3端的碱基,将所有大于15bp的读长修剪成15bp。对独特读长的数量进行定量,前5个最频繁的读长显示于图9。在图9中,对读长进行反向补充,以5'->3'方式读取原始LNA寡核苷酸。

实例9:

Crouzier等人描述了Superscript III逆转录酶(RT)(Thermos Scientific)具有在逆转录RNA链时通读LNA核苷酸(LNA-T和LNA-A)的能力。作者表明,SuperScript III RT在读取RNA模板时可以掺入非连续的LNA-T和LNA-A。作者还表明,Superscript III RT仅使用常规的dNTP即可逆转录包含2个LNA A和2个LNA T(不连续)的RNA模板(Crouzier等人,2012年,图3小图C泳道2)。

由于已证明SuperScript III RT能够逆转录RNA磷酸二酯链接链中包含非连续LNA的链(Crouzier等人,2012),因此我们想了解它是否还能够在同样含有硫代磷酸酯主链的DNA链中读取整个连续LNA。因此,我们执行LTT1模板的第一链合成,然后使用EvaGreenddPCR进行第一链检测,如实例2中所述。我们比较了SuperScript III RT创建LTT1拷贝的能力与Vulcano2G聚合酶的能力。第一链SuperScript III RT反应的反应条件与Crouzier等人2012中所述的相同。

10ul第一链合成反应:

包含所有反应(1ul LTT1(31pM)、0.5ul DCP1_primer1(1uM)和水添加10ul)。使用供应商提供的缓冲液运行酶。

a)2ul 5倍第一链缓冲液、1ul MgCL

b)2ul 5倍第一链缓冲液、1ul MgCL

c)2ul 5倍Vulcano2G缓冲液、1ul dNTP(10mM)

d)2ul 5倍Vulcano2G缓冲液、1ul dNTP(10mM)、0.2ul Vulcano2G

加入除了酶之外的所有组分,将混合物加热至65℃持续5min,然后置于冰上1min,然后最终加入RT酶。在4个条件下完成第一链合成。

a)45min 50℃,5min 80℃,保持4℃

b)5min 50℃,保持4℃

c)3次循环(5min 50℃,30sec 98℃)然后保持4℃

d)5次循环(5min 50℃,30sec 98℃)然后保持4℃

由于Vulcano2G酶是热稳定的,因此添加了条件c和d中的循环条件,所以可使用此酶进行多轮第一链合成以提高敏感性,这不同于因使双链变性所需的温度更高而失活的Superscript III RT。

将所有第一链反应用水稀释100倍,并将2ul样本用作常规QX200

结果:

图10小图A显示在1次45min第一链合成反应中执行的EvaGreen ddPCR反应中微滴的荧光强度。我们没有看到SuperScript III RT能够产生LTT1的第一链拷贝的迹象,因为在没有酶的反应中也看到了相同数量的阳性微滴。检测到的拷贝的定量显示在图10小图B中,显示Vulcano2G产生LTT1模板的第一链拷贝的能力远为优越。图10小图C显示用1、3或5轮第一链合成进行的EvaGreen ddPCR反应中微滴的荧光强度。检测到的拷贝的定量显示在图10小图D中,显示由于Vulcano2G的热稳定性,它可以执行数轮第一链合成反应,可用于增加对含有LNA的分子的检测。同样地,我们没有看到SuperScript III RT可以逆转录LTT1模板的迹象。

参考:

Crouzier等人(2012)Efficient Reverse Transcription Using LockedNucleic Acid Nucleotides towards the Evolution of Nuclease Resistant RNAAptamers.PLoS ONE 2012年4月,第7卷,第4期,e35990

数据显示了原则性的证明,即可以使用测序研究与包含DNA/PS寡核苷酸的条形码缀合的各种化学部分的文库以了解其在单个动物中的肝脏富集。数据显示了原则性的证明,即与裸寡核苷酸(SEQ ID 35)相比,皮下注射后4h,GalNAc缀合的寡核苷酸(SEQ ID 22)在肝脏中富集。数据还确定,与裸寡核苷酸SEQ ID 37相比,皮下注射4h后SEQ ID 26在肝脏中富集。将每种寡核苷酸的5μM溶液(下表)以每只小鼠0.25mL的剂量皮下注射到C57BL/6J小鼠(n=3)体内,注射后4h收获肝脏。

表.具有缀合的条形码寡核苷酸文库。用于识别的条形码以粗体显示。图13-24提供了缀合物基团。

缀合以化学结构或文字形式显示。在化学结构中,波浪线表示与寡核苷酸的共价键,通过接头,例如C6烷基接头基团以适合5'末端。

表13

体内注射后4h,使用Tissue Lyzer(Qiagen)在含有0.1M CaCl2、0.1M Tris pH8.0和1%NP-40的400μL缓冲液中匀浆肝组织样本(100mg)。平行地,将10μL含有5μM每个寡核苷酸的溶液加标入如上所述匀浆的离体肝脏样本(100mg,n=3)中。加入25μL蛋白酶K(Sigma)后,将样本在50℃孵育过夜。然后加入1μL RNAseif(New England Biolabs)和1μLDNase I(Qiagen),将样本在37℃孵育1h,通过在99℃孵育15min来灭活核酸酶。将样本以10000g离心10分钟,然后使用Amicon Ultra 0.5mL离心式MWCO 3 kDa过滤器将上清液洗涤三次,洗涤通过在每个洗涤步骤中添加约400μL蒸馏水来执行。在第一连接反应中使用2μL剩余的上清液(约50μL),其中包含1μL捕获探针1(10μM)、2μL T4连接酶缓冲液、6μL PEG、1μL T4连接酶(ThermoFisher Scientific)和8μL蒸馏水。将每个样本与特异性索引序列的特异性捕获探针连接,以便以后鉴定来自每个单独样本的序列(参见下表)。

表14.捕获探针1的文库。识别索引以粗体显示

在16℃孵育1h并在75℃灭活15min后,向该第一连接产物反应中加入等体积的2倍

根据制造商的说明,使用Monarch PCR和DNA清理试剂盒(New England Biolabs)纯化第一链PCR产物,并在10μL洗脱缓冲液中洗脱。然后将8μL洗脱的第一链产物与2μL捕获探针2(100nM)连接,并加热至60℃持续5min,接着缓慢(0.1℃/s)降至4℃。然后加入10μL,包括2μL T4连接酶缓冲液、6μL PEG、1μL T4连接酶(ThermoFisher Scientific)和1μL蒸馏水。

在16℃孵育1h并在75℃灭活15min后,将2μL的连接反应物应用于含有4μL 5倍HF缓冲液(New England Biolabs)、0.4μL 10mM dNTP、1μL 10μM正向测序引物(PE1)和1μL 10μM反向测序引物(PE2V2)、0.2μL Phusion DNA聚合酶(New England Biolabs)和11.4μL蒸馏水的PCR反应。PCR条件为98℃持续30s,然后进行20个循环,内容是98℃持续15s、60℃持续20s和72℃持续20s,最后是72℃持续5min。按照制造商的说明,使用Qiaquick PCR纯化试剂盒(Qiagen)纯化PCR产物,并在30μL蒸馏水中洗脱。

根据来自Illumina MiniSeq System(Illumina)的方案对PCR产物进行测序。通过使用CLC Genomics Workbench软件,识别不同条形码的11.0.1(Qiagen)读长数量,并计算条形码的相对丰度。最后,计算体内肝脏相对丰度与离体加标肝脏样本相对丰度的比率。

表15.4h肝脏样本读长数量,以及每个样本的相对丰度(n=3)。

图11示出皮下注射后4h相对于未缀合的寡核苷酸(SEQ ID 35)的肝脏富集倍数。与未缀合的寡核苷酸(SEQ ID 35)相比,GalNAc缀合的寡核苷酸(SEQ ID 22)以及SEQ ID26显示出3.5倍的肝脏富集。

实例11

数据显示了原则性的证明,即可以使用测序研究与包含DNA/PS寡核苷酸的条形码缀合的各种化学部分的文库以了解其在单个动物中的血浆滞留率。数据显示了原则性的证明,即皮下注射后4h,与寡核苷酸缀合的白蛋白结合C16棕榈酸酯在血浆中富集。数据还确定与裸寡核苷酸相比,GalNAc缀合的寡核苷酸从循环中去除。

将每种寡核苷酸在PBS中的5μM溶液(参见下表)以每只小鼠0.25mL的剂量皮下注射到C57BL/6J小鼠8(n=3)体内,注射后4h取血浆样本。

表.具有缀合的条形码寡核苷酸文库。用于识别的条形码以粗体显示。

所用化合物在上表13中显示为缀合物,并进一步包括化合物SEQ ID NO 46:

注射后4h,使用Tissue Lyzer(Qiagen)在240μL RIPA缓冲液(Qiagen)中匀浆10μL血浆样本。平行地,将10μL含有5μM每种寡核苷酸的溶液加标到10μL离体血浆样本中,然后如上所述在240μL RIPA缓冲液中匀浆样本。然后在第一连接反应中使用2μL均质血浆RIPA溶液,其中包含1μL捕获探针1(1nM)、2μL T4连接酶缓冲液、6μL PEG、1μL T4连接酶(ThermoFisher Scientific)和8μL蒸馏水。将每个样本与特异性索引序列的特异性捕获探针1连接,以便以后鉴定每个单独样本。

表16:捕获探针1的文库。识别索引以粗体显示

在16℃孵育1h并在75℃灭活15min后,将2μl的连接反应物用于第一链合成,其中包含2μL的连接反应物、4μL 5倍Volcano缓冲液(MyPols),0.4μL第一链引物1μM、0.5μL10mM dNTP、0.4μL Volcano PG(MyPols)和12.7μL蒸馏水。PCR条件为95℃持续3min,然后进行15次循环,内容是95℃持续30s,55℃持续30min和72℃持续1min。

收集所有第一链PCR产物,并按照制造商的说明使用Monarch PCR和DNA清理试剂盒(New England Biolabs)纯化50μL合并的第一链PCR产物,并在10μL洗脱缓冲液中洗脱。然后将8μL洗脱的第一链产物与2μL捕获探针2(100nM)连接,并加热至60℃持续5min,接着缓慢(0.1℃/s)降至4℃。然后加入10μL,包括2μL T4连接酶缓冲液、6μL PEG、1μL T4连接酶(ThermoFisher Scientific)和1μL蒸馏水。

在16℃孵育1h并在75℃灭活15min后,将2μL的连接反应物添加至含有4μL 5倍HF缓冲液、0.4μL 10mM dNTP、1μL 10μM正向测序引物(PE1)、1μL 10μM反向测序引物(PE2V2)、0.2μL Phusion DNA聚合酶(New England Biolabs)和11.4μL蒸馏水中进行PCR反应。PCR条件为98℃持续30s,然后进行20次循环,内容是98℃持续15s,60℃持续20s和72℃持续20s,最后72℃持续5min。

根据制造商的说明,使用QIAquick PCR纯化试剂盒(Qiagen)纯化PCR产物,并在30μL蒸馏水中洗脱。根据来自Illumina MiniSeq System(Illumina)的方案对PCR产物进行测序。通过使用CLC Genomics Workbench软件,识别不同条形码的11.0.1读长数量,并计算条形码的相对数量。最后,计算体内血浆相对丰度与离体加标血浆样本的比率。

表17.4h血浆样本读长数量,以及每个样本的相对丰度(n=3)。

表18.4h血浆样本读长的相对丰度(平均值和标准差)以及体内与加标血浆的比率。

图12示出皮下注射后4h相对于未缀合的寡核苷酸化合物SEQ ID 35的血浆富集。与裸寡核苷酸SEQ ID 35相比,具有C16脂肪酸缀合的寡核苷酸(SEQ ID 46)显示出12.5倍的血浆丰度。GalNAc缀合的寡核苷酸(SEQ ID 22)显示从血浆耗减。

实例12

数据显示了原则性的证明,即可以使用测序研究与包含含有LNA/DNA/PS寡核苷酸的条形码缀合的各种化学部分的文库以了解单个动物中多个组织中的组织递送特性。数据还表明,静脉注射3天后,胆固醇缀合的(SEQ ID 49和50)和生育酚缀合的寡核苷酸(SEQ ID60和61)在肝脏中富集并且在肾脏中减少。数据还表明胆汁胺缀合的(SEQ ID 51和52)增加了胰腺中寡核苷酸的含量。

将15个条形码寡核苷酸组成的文库(下表)以10mg/kg的剂量(所有寡核苷酸)静脉注射到C57BL/6J小鼠(n=2)体内。3天后收集并分析以下器官:脂肪组织、皮层、眼球、股骨、心脏、髂骨、肾脏、肝脏、肺脏、淋巴结、胰腺、血清、脊髓、脾脏和胃。

表19.具有缀合的条形码寡核苷酸文库。用于识别的条形码以粗体显示。缀合以文字形式显示。LNA核苷酸显示为大写字母。

注射后3天,使用Tissue Lyzer(Qiagen)在RIPA缓冲液(Pierce)中匀浆组织样本。根据其重量以10mg组织/450μL Ripa缓冲液的比例将组织在一定体积的RIPA缓冲液中匀浆。然后将匀浆的肝脏、肾脏和肺脏组织在蒸馏水中稀释100倍,而其他组织在蒸馏水中稀释10倍。通过将样本在75℃孵育40min,然后在4℃孵育15min来完成DNase灭活。平行地,两个用于参比标准化的样本由10μL的溶液组成,该溶液包含5μM(每种)寡核苷酸文库和490μLRIPA缓冲液(每种寡核苷酸最终100nM)。

在第一连接反应中使用4μL RIPA溶液,其中包含2μL捕获探针1(1nM)、2μL T4连接酶缓冲液、6μL PEG、0.25μL T4连接酶(ThermoFisher Scientific)和5.75μL蒸馏水。将每个组织样本与具有特定索引序列的特定捕获探针1连接,以便以后鉴定每个单独样本,参见下表。

表20 32个捕获探针1的文库。识别索引以粗体显示

在16℃孵育1h并在75℃灭活15min后,将2μl的连接反应物在反应中用于第一链合成,该反应包含2μL的连接反应物、4μL 5倍Volcano缓冲液(MyPols),0.5μL第一链引物100nM、0.5μL 10mM dNTP、0.4μL Volcano PG(MyPols)和12.6μL蒸馏水。PCR条件为95℃持续2min,然后进行15次循环,依次是95℃持续30s和60℃持续30min,最后72℃持续5min。

收集所有第一链PCR产物,并按照制造商的说明使用Monarch PCR和DNA清理试剂盒(New England Biolabs)纯化50μL合并的第一链PCR产物,并在10μL洗脱缓冲液中洗脱。然后将4μL洗脱的第一链产物与4μL捕获探针2(100nM)混合,并加热至60℃持续5min,接着缓慢(0.1℃/s)降至4℃。然后加入12μL,包括2μL T4连接酶缓冲液、6μL PEG、0.5μL T4连接酶(ThermoFisher Scientific)和3.5μL蒸馏水。

在4℃孵育1h并在75℃灭活15min后,将2μL的连接反应物应用于含有4μL 5倍HF缓冲液、0.4μL 10mM dNTP、1μL 10μM正向测序引物(PE1)和1μL 10μM反向测序引物(PE2V3)、0.2μL Phusion DNA聚合酶(New England Biolabs)和11.4μL蒸馏水的PCR反应。PCR条件为98℃持续30s,然后进行20次循环,内容是98℃持续15s,60℃持续20s和72℃持续20s,最后72℃持续5min。

根据制造商的说明,使用QIAquick PCR纯化试剂盒(Qiagen)纯化PCR产物,并在30μL蒸馏水中洗脱。根据来自Illumina MiniSeq System(Illumina)的方案对PCR产物进行测序。通过使用软件CLC Genomics Workbench,11.0.1。确定不同条形码的读长数量,并计算每个捕获索引(每个组织样本)的条形码的相对数量。将每个条形码的相对数量归一化(%)为索引参考文库1中来自试管反应的条形码的相对数量。

表21.两只C57BL/6J小鼠静脉注射后3天的组织样本读长数量。

表22.每个组织样本中条形码寡核苷酸的读长的相对丰度,相对于参考文库1的读长的相对丰度进行归一化(%)。读长的相对丰度显示,与裸寡核苷酸SEQ ID 55、56和57以及其他缀合相比,生育酚缀合(化合物SEQ ID 58和SEQ ID 59)和胆固醇缀合(SEQ ID 47和SEQ ID 48)具有增加的肝脏分布和减少的肾脏分布。胆汁胺缀合(SEQ ID 49和SEQ ID 50)显示胰腺中含量增加。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号