首页> 中国专利> 用于单细胞处理中的质量控制的系统和方法

用于单细胞处理中的质量控制的系统和方法

摘要

提供了用于分析单细胞应用或实验的系统和方法。一组对照珠粒可被引入生物样品并进行所述单细胞应用。所述对照珠粒可被构造为模拟所述生物样品中的分析物,例如细胞或其它分析物,并包括一个或多个已知序列。可鉴定所述一个或多个已知序列以分析所述单细胞应用。

著录项

说明书

交叉引用

本申请要求2018年4月6日提交的美国临时申请第62/653,815号的权益,所述美国临时申请出于所有目的通过引用整体并入本文中。

背景技术

可出于各种目的对样品进行处理,例如鉴定样品内的部分的类型。样品可以是生物样品。生物样品可经处理,例如用于检测疾病(例如癌症)或鉴定特定物种。存在多种处理样品的方法,例如聚合酶链反应(PCR)和测序。所述处理可以是单细胞处理,例如以产生对于单个细胞特定和不同的数据。

生物样品可在各种反应环境(例如分区)内处理。分区可以是孔或液滴。液滴或孔可用于以使得生物样品能够被单独分区和处理的方式来处理生物样品。例如,这样的液滴可以与其它液滴流体隔离,从而能够精确控制液滴中的各个环境。

分区中的生物样品可经历各种过程,例如化学过程或物理过程。分区中的样品可经历加热或冷却,或化学反应,例如以产生可定性或定量处理的物质。

发明内容

单细胞处理实验变得越来越普遍和高效。大规模并行测序或下一代测序例如允许高通量处理,一次操作即可产生数千个、数万个、数十万个或数百万个或更多个碱基读段。然而,在通常情况下,来自实验的结果(例如数据)仅与可验证实验过程本身一样可靠,也就是说,实验是按设计进行的。例如,实验可能具有不同的灵敏度、准确度和/或偏差,这些灵敏度、准确度和/或偏差不一定(如果有的话)反映在数据结果中。鉴于单细胞测定的规模相对较小且通量较高,以及这些测定中某些测定的不可复制性(在即时测定期间可能会消耗或污染唯一的样品),因此难以对以下进行验证或研究或以其它方式进行质量控制(QC):在单细胞测定期间实验的执行情况如何,或者能够比较两个或更多个不同的单细胞测定,或其结果。

用于单细胞测序实验的质量控制的一种方法可涉及将对照引入待测序的样品中,并跟踪所述对照。例如,外部RNA对照协会(External RNA Controls Consortium,ERCC)已开发了具有已知序列的核糖核酸(RNA)对照转录物(ERCC RNA Spike-In Controls),可将其掺入RNA样品中以输入到RNA测序(RNA-seq)实验中。然后可将掺入的RNA-seq实验的结果与已知的对照序列进行比较,例如以便确定实验是否能够适当地检测到对照,或者在什么剂量的对照下实验能够检测到对照以评估灵敏度等。质量控制的另一种方法可能涉及将外源基因组或表观基因组作为参考引入样品中,例如用于归一化染色质免疫沉淀测序(ChIP-seq)分析。然而,在单细胞实验中,这样的控制方法无法模拟真正的单细胞行为,将上述方法描述为对细胞中的分析物(例如核酸、染色质等)而非细胞的处理进行质量控制会更为准确。例如,已知核酸(例如已知转录物)以相等的量均一地分布到所有分区,包括已含有细胞的分区,从而固有地偏向于单细胞实验。此外,使用大量ERCC对照需要仔细地控制输入浓度和二次采样以管理测序要求,这两者都会引入可能影响质量控制的操作变量。另外,使用大量ERCC对照不允许对单细胞实验中涉及的微流体进行质量控制。

本文中认识到需要用于对至少解决上述问题的单细胞处理实验进行质量控制的系统和方法。提供了在单细胞处理实验中模拟单细胞行为的合成细胞。合成细胞可以是包含一个或多个已知序列的珠粒。珠粒可以是凝胶珠粒。合成细胞可被引入细胞样品中并具有与细胞样品中的其它细胞大致相同或基本相同的尺寸。合成细胞可通过利用细胞样品进行单细胞处理实验的整个工作流进行携带。测序后,可鉴定和分析合成细胞中的一个或多个已知序列,以确定单细胞处理实验的各种特征,例如文库制备过程或测序过程的有效性或效率。

在一个方面,提供了一种用于分析细胞样品中的单细胞过程的方法,所述方法包括:(a)提供多个分析物载体、多个对照珠粒和多个条形码珠粒;(b)产生包括第一分区和第二分区的多个分区,其中(i)所述第一分区包括来自所述多个分析物载体的分析物载体和来自所述多个条形码珠粒的第一条形码珠粒,其中所述分析物载体包括模板核酸分子,并且其中所述第一条形码珠粒包括包含第一条形码序列的第一核酸条形码分子,并且(ii)所述第二分区包括来自所述多个对照珠粒的对照珠粒和来自所述多个条形码珠粒的第二条形码珠粒,其中所述第二条形码珠粒包括包含第二条形码序列的第二核酸条形码分子,其中所述第二条形码序列不同于所述第一条形码序列,并且其中所述对照珠粒包括包含已知序列的核酸分子;(c)使用(i)所述模板核酸分子和所述第一核酸条形码分子来生成条形码化模板核酸分子,以及(ii)所述包含已知序列的核酸分子和所述第二核酸条形码分子来生成包含已知序列的条形码化核酸分子;以及(d)对所述条形码化模板核酸分子或其衍生物以及所述条形码化核酸分子或其衍生物进行测序,其中(i)所述条形码化模板核酸分子的序列标识所述分析物载体,并且(ii)所述条形码化核酸分子的序列标识所述对照珠粒。

在一些实施方案中,所述方法还包括鉴定已知序列以分析单细胞过程。

在一些实施方案中,所述方法还包括提供多个第二对照珠粒,其中多个分区包括第三分区,其中所述第三分区包括来自多个条形码珠粒的第三条形码珠粒和来自多个第二对照珠粒的第二对照珠粒,其中所述第三条形码珠粒包括包含第三条形码序列的第三核酸条形码分子,其中所述第三条形码序列不同于所述第一条形码序列和所述第二条形码序列,并且其中所述第二对照珠粒包括包含第二已知序列的第二核酸分子,其中所述第二已知序列不同于所述已知序列。

在一些实施方案中,所述方法还包括产生包含第二已知序列的第二条形码化核酸分子,其中所述第二条形码化核酸分子的序列标识第二已知序列。在一些实施方案中,所述方法还包括处理已知序列和第二已知序列以分析单细胞过程。在一些实施方案中,所述方法还包括处理包括比较已知序列的频率与第二已知序列的频率以分析单细胞过程。在一些实施方案中,所述处理还包括确定双重峰率。

在一些实施方案中,第二对照珠粒的尺寸与分析物载体的平均尺寸相差约70%以内。在一些实施方案中,第二对照珠粒的尺寸与分析物载体的平均尺寸相差约40%以内。在一些实施方案中,第二对照珠粒的尺寸与分析物载体的平均尺寸相差约25%以内。在一些实施方案中,第二对照珠粒的尺寸与分析物载体的平均尺寸相差约10%以内。在一些实施方案中,第二对照珠粒的尺寸与分析物载体的平均尺寸相差约5%以内。

在一些实施方案中,第二对照珠粒的尺寸与对照珠粒的平均尺寸相差约40%以内。在一些实施方案中,第二对照珠粒的尺寸与对照珠粒的平均尺寸相差约25%以内。在一些实施方案中,第二对照珠粒的尺寸与对照珠粒的平均尺寸相差约10%以内。在一些实施方案中,第二对照珠粒的尺寸与对照珠粒的平均尺寸相差约5%以内。

在一些实施方案中,已知序列源自第一物种并且第二已知核酸序列源自第二物种。在一些实施方案中,第一物种是人类并且其中第二物种是小鼠。

在一些实施方案中,对照珠粒的尺寸与分析物载体的平均尺寸相差约40%以内。在一些实施方案中,对照珠粒的尺寸与分析物载体的平均尺寸相差约25%以内。在一些实施方案中,对照珠粒的尺寸与分析物载体的平均尺寸相差约10%以内。在一些实施方案中,对照珠粒的尺寸与分析物载体的平均尺寸相差约5%以内。

在一些实施方案中,对照珠粒的尺寸为约15微米至约35微米。在一些实施方案中,对照珠粒的尺寸为约35微米至约60微米。

在一些实施方案中,来自多个条形码珠粒的给定珠粒包含多个包含共同条形码序列的核酸条形码分子。在一些实施方案中,所述共同条形码序列不同于多个珠粒中的其它珠粒的共同条形码序列。

在一些实施方案中,所述方法还包括,在(b)之前,将来自多个分析物载体的分析物载体与多个对照珠粒的对照珠粒混合。

在一些实施方案中,所述方法还包括,在(b)之前,将来自多个分析物载体的分析物载体与多个对照珠粒的对照珠粒和第二多个对照珠粒的对照珠粒混合。在一些实施方案中,来自多个对照珠粒的对照珠粒以第一浓度存在于混合物中,其中来自第二多个对照珠粒的对照珠粒以第二浓度存在于混合物中,并且其中所述第一浓度和所述第二浓度是已知的。在一些实施方案中,第一浓度与第二浓度的比率为至少约1:0.001。在一些实施方案中,混合物中分析物载体的浓度与第一浓度的比率是已知的。在一些实施方案中,所述比率为约0.001:1。

在一些实施方案中,对照珠粒包含多个独特核酸分子,其具有在长度、浓度和/或GC含量上变化的已知核酸序列。在一些实施方案中,所述多个独特核酸分子是多个DNA分子。在一些实施方案中,所述多个独特核酸分子是多个RNA分子。

在一些实施方案中,(i)对照珠粒包含第一多个独特核酸分子,其具有在长度、浓度和/或GC含量上变化的已知核酸序列,并且其中(ii)第二对照珠粒包含第二多个独特核酸分子,其具有在长度、浓度和/或GC含量上变化的已知核酸序列,其中所述第一多个独特核酸分子和所述第二多个独特核酸分子是不同的。

在一些实施方案中,第一多个独特核酸分子和第二多个独特核酸分子都是多个DNA分子。在一些实施方案中,第一多个独特核酸分子和第二多个独特核酸分子都是多个RNA分子。

在一些实施方案中,来自多个条形码珠粒的给定珠粒包含多个核酸条形码分子,其中所述多个核酸条形码分子中的每一个包含标识符序列,其中所述标识符序列不同于与多个核酸条形码分子中的其它核酸条形码分子相关联的标识符序列。在一些实施方案中,所述方法还包括鉴定与第一多个独特核酸分子相关联的第一组标识符和与第二多个独特核酸分子相关联的第二组标识符。在一些实施方案中,所述方法还包括处理所述第一组标识符和所述第二组标识符以确定用于单细胞过程的标识符纯度。

在一些实施方案中,来自多个条形码珠粒的给定珠粒包含可释放地附接于其上的多个核酸条形码分子。在一些实施方案中,第一核酸条形码分子和第二核酸条形码分子从第一条形码珠粒和第二条形码珠粒释放。

在一些实施方案中,多个条形码珠粒是多个凝胶珠粒。

在一些实施方案中,核酸分子可释放地附接至对照珠粒。在一些实施方案中,核酸分子从对照珠粒释放。

在一些实施方案中,核酸分子在对照珠粒内。

在一些实施方案中,对照珠粒包含第一官能团,并且所述包含已知序列的核酸分子包含第二官能团。在一些实施方案中,通过使所述第一官能团与所述第二官能团反应,将包含已知序列的核酸分子附接至所述对照珠粒。在一些实施方案中,第一官能团是炔烃、反式环辛烯或抗生物素蛋白或其任何组合。在一些实施方案中,第一官能团是炔烃。在一些实施方案中,第二官能团是叠氮化物、四嗪或生物素,或其组合。在一些实施方案中,第二官能团是叠氮化物。在一些实施方案中,第一官能团在点击反应中与所述第二官能团反应。在一些实施方案中,所述点击反应是铜催化的叠氮化物-炔烃环加成反应、逆电子需求Diels-Alder反应或抗生物素蛋白-生物素相互作用。在一些实施方案中,所述点击反应是铜催化的叠氮化物-炔烃环加成反应。

在一些实施方案中,使用除点击化学以外的生物缀合化学,将所述对照珠粒附接至包含已知序列的所述核酸分子。因此,在一些实施方案中,所述第一官能团是羧酸,并且所述第二官能团是胺。所述第一官能团可通过酰胺键形成反应与所述第二官能团反应。这种酰胺键形成反应还可包含1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(EDC)、N-羟基琥珀酰亚胺(NHS)或其组合。

在一些实施方案中,已知序列是合成的。

在一些实施方案中,已知序列源自生物样品。

在一些实施方案中,对照珠粒包含蛋白质-DNA复合物,并且核酸分子是所述蛋白质-DNA复合物的一部分。在一些实施方案中,已知序列包含限定的蛋白质结合位点。在一些实施方案中,单细胞过程包括ATAC-seq。

在一些实施方案中,多个分析物载体是多个细胞。在一些实施方案中,多个分析物载体是多个细胞核。在一些实施方案中,多个分析物载体是多个细胞珠粒。

在一些实施方案中,多个分区是多个液滴。在一些实施方案中,多个分区是多个孔。

在另一方面,提供了一种用于分析包含分析物载体的细胞样品的试剂盒,所述试剂盒包括:一组对照珠粒,其中所述对照珠粒组的至少一个亚组包含(i)相同的核酸分子,每个核酸分子均包含已知核酸序列,并且(ii)具有对应于与所述分析物载体的特征的平均值相差70%以内的所述特征;以及包含所述已知核酸序列的索引。

在一些实施方案中,所述特征选自由以下组成的组:尺寸、形状、密度、电导率、硬度、可变形性和疏水性。

在一些实施方案中,所述索引包括已知核酸序列的浓度。

在一些实施方案中,所述对照珠粒组包括对照珠粒的第一亚组和对照珠粒的第二亚组。在一些实施方案中,所述对照珠粒的第一亚组包括包含第一组已知序列的第一组核酸分子,并且所述对照珠粒的第二亚组包括包含第二组已知序列的第二组核酸分子。在一些实施方案中,所述第一组已知序列包括96个不同的已知序列,并且所述第二组已知序列包括96个不同的已知序列。在一些实施方案中,所述第一组已知序列的所述96个不同的已知序列不同于所述第二组已知序列的所述96个不同的已知序列。在一些实施方案中,所述对照珠粒的第一亚组和所述对照珠粒的第二亚组以一定比率存在。在一些实施方案中,所述比率为至少约1:0.001、1:0.01、1:0.1、1:0.2、1:0.3、1:0.4、1:0.5、1:0.6、1:0.7、1:0.8、1:0.9、1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90、1:100或1:1000。在一些实施方案中,所述比率为至多约1:1000、1;100、1:90、1:80、1:70、1:60、1:50、1:40、1:30、1:20、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1.9、1:1.8、1:1.7、1:1.6、1:1.5、1:1.4、1:1.3、1:1.2、1:1.1、1:1、1:0.9、1:0.8、1:0.7、1:0.6、1:0.5、1:0.4、1:0.3、1:0.2、1:0.1、1:0.01或1:0.001。在一些实施方案中,所述比率为约1:2。

在一些实施方案中,对照珠粒的亚组包含与相同核酸分子不同的另外的相同核酸分子,其中每个另外的核酸分子包含另外的已知核酸序列。在一些实施方案中,索引包括另外的已知核酸序列。在一些实施方案中,索引包括另外的已知核酸序列的浓度。在一些实施方案中,已知核酸序列和另外的已知核酸序列在长度、浓度和/或GC含量上变化。

本公开的另一方面提供了一种包括机器可执行代码的非暂态计算机可读介质,所述机器可执行代码在由一个或多个计算机处理器执行时,实现上文或本文其它地方的任何方法。

本公开的另一方面提供了一种系统,所述系统包括一个或多个计算机处理器和与其耦合的计算机存储器。所述计算机存储器包括机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时,实现上文或本文其它地方的任何方法。

根据下面的详细描述,本公开的其它方面和优点对于本领域技术人员来说将变得显而易见,其中仅示出和描述了本公开的说明性实施方案。将认识到,本公开内容能够具有其它和不同的实施方案,并且其若干细节能够在各种明显的方面进行修改,所有这些都不脱离本公开内容。因此,附图和描述本质上应被认为是说明性的,而不是限制性的。

通过引用并入

本说明书中提到的所有出版物、专利和专利申请都以引用的方式并入本文中,其程度就如同每个单独的出版物、专利或专利申请被明确地且单独地指出通过引用并入一样。在通过引用并入的出版物和专利或专利申请与本说明书中包含的公开内容相矛盾的程度上,本说明书旨在取代和/或优先于任何此类相矛盾的材料。

附图说明

本发明的新颖特征在所附权利要求书中具体阐述。通过参考阐述利用本发明原理的说明性实施方案的以下详细描述和附图(本文也称为“图(Figure)”和“图(FIG.)”),可以更好地理解本发明的特征和优点,在附图中:

图1示出了用于对单个分析物载体进行分区的微流体通道结构的一个实例。

图2示出了用于将携带条形码的珠粒递送至液滴的微流体通道结构的一个实例。

图3示出了用于对分析物载体和试剂进行共分区的微流体通道结构的一个实例。

图4示出了用于将珠粒受控分区到离散液滴中的微流体通道结构的一个实例。

图5示出了用于增加液滴产生通量的微流体通道结构的一个实例。

图6示出了用于增加液滴产生通量的微流体通道结构的另一个实例。

图7A示出了具有用于受控分区的几何特征的微流体通道结构的另一个实例的横截面图。图7B示出了图7A的通道结构的透视图。

图8示出了携带条形码的珠粒的一个实例。

图9示出了用于对单细胞实验进行质量控制的方法。

图10示出了可以特定的已知比率用作测序标准物的两个合成细胞。

图11示出了从RNA转录物开始的具有加帽和拖尾的HiScribe RNA合成。

图12A示出了数字液滴PCR结果,其显示了源自第一转录物的连接的(含叠氮化物)和未连接的RNA序列。图12B示出了数字液滴PCR结果,其显示了源自第二转录物的连接的(含叠氮化物)和未连接的RNA序列。

图13示出了使用点击化学将由RNA转录物产生的RNA序列(例如,叠氮化物官能化的)附接至凝胶珠粒(例如,炔烃官能化的)上以产生合成细胞(例如对照珠粒)。点击反应可以是Cu介导的叠氮化物-炔烃环加成反应。

图14A示出了对照点击反应的荧光光谱,其仅含有炔烃而不含叠氮化物,因此预期没有点击反应产物。图14B示出了荧光信号的右移,表明荧光强度增加,从而证实了在第一测试反应中,通过Cu介导的叠氮化物-炔烃点击反应,用叠氮化物修饰的RNA分子对炔烃官能化的凝胶珠粒进行了官能化。图14C示出了荧光信号的右移,表明荧光强度增加,从而证实了在第二测试反应中,通过Cu介导的叠氮化物-炔烃点击反应,用叠氮化物修饰的RNA分子对炔烃官能化的凝胶珠粒进行了官能化。图14D示出了荧光信号的右移,表明荧光强度增加,从而证实了在第三测试反应中,通过Cu介导的叠氮化物-炔烃点击反应,用叠氮化物修饰的RNA分子对炔烃官能化的凝胶珠粒进行了官能化。

图15示出了指示来自互补DNA(cDNA)片段的信号的图,所述互补DNA(cDNA)片段与所测试的两个转录物的预期转录物大小相匹配。约75bp下的另外的峰可能是由于所形成的引物二聚体。

图16示出了生物分析仪迹线,表明在大约311bp和674bp下检测到预期的转录物。所观测到的峰宽可能是由于核酸分子的随机断裂。

图17示出了被编程或以其它方式配置为实现本文提供的方法的计算机系统。

具体实施方式

尽管已经在本文中示出和描述了本发明的各种实施方案,但是对于本领域技术人员来说显而易见的是,这些实施方案仅以示例的方式提供。在不脱离本发明的情况下,本领域技术人员可想到许多变化、改变和替换。应理解,可采用本文所述的本发明的实施方案的各种替代方案。

在将值描述为范围的情况下,应理解,所述公开内容包括在所述范围内的所有可能的子范围的公开内容,以及落入所述范围内的特定数值,而不管是否明确指出是特定数值还是特定子范围。范围可在本文中表示为从“约”一个特定值和/或至“约”另一特定值。当表述这样的范围时,另一可能性包括从一个特定值和/或至另一特定值。类似地,当通过使用先行词“约”将值表示为近似值时,应理解,特定值可以是另一种可能性。还应理解,每个范围的端点都相对于另一端点,并且独立于另一端点。如本文所用,术语“约”可以指在特定使用的上下文中相对于所述数值为±15%的范围。例如,约10可包括8.5至11.5的范围。

如本文所用,术语“条形码”通常是指标签或标识符,其传达或能够传达关于分析物的信息。条形码可以是分析物的一部分。条形码可独立于分析物。条形码除了可以是分析物的内源性特征(例如,分析物的大小或末端序列)之外,还可以是附接至分析物(例如,核酸分子)的标签或标签组合。条形码可能是唯一的。条形码可具有多种不同的格式。例如,条形码可包括:多核苷酸条形码;随机核酸和/或氨基酸序列;以及合成的核酸和/或氨基酸序列。条形码可以可逆或不可逆的方式附接至分析物。可在样品测序之前、期间和/或之后将条形码添加到例如脱氧核糖核酸(DNA)或核糖核酸(RNA)样品的片段中。条形码可允许鉴定和/或定量单个测序读段。

如本文所用,术语“实时”可以指小于大约1秒、十分之一秒、百分之一秒、毫秒或更少的响应时间。响应时间可能大于1秒。在一些情况下,实时可以指同时或基本同时的处理、检测或鉴定。

如本文所用,术语“受试者”通常是指动物,例如哺乳动物(例如人类)或禽类(例如鸟),或其它生物,例如植物。例如,受试者可以是脊椎动物、哺乳动物、啮齿动物(例如小鼠)、灵长类动物、猿猴或人类。动物可包括但不限于农场动物、运动动物和宠物。受试者可以是健康或无症状的个体,患有或疑似患有疾病(例如癌症)或易感疾病的个体,和/或需要治疗或疑似需要治疗的个体。受试者可以是患者。受试者可以是微生物体或微生物(例如细菌、真菌、古细菌、病毒)。

如本文所用,术语“基因组”通常是指来自受试者的基因组信息,其可以是例如受试者的遗传信息的至少一部分或全部。基因组可编码于DNA或RNA中。基因组可包含编码区(例如,编码蛋白质的区域)以及非编码区。基因组可包括生物体中所有染色体一起的序列。例如,人类基因组通常具有总共46条染色体。所有这些序列可共同构成人类基因组。

术语“衔接头”、“衔接子”和“标签”可同义使用。衔接头或标签可通过任何方法(包括连接、杂交或其它方法)与多核苷酸序列偶联以被“标记”。

如本文所用,术语“测序”通常是指用于确定一种或多种多核苷酸中核苷酸碱基的序列的方法和技术。多核苷酸可以是例如核酸分子,例如脱氧核糖核酸(DNA)或核糖核酸(RNA),包括其变体或衍生物(例如单链DNA)。测序可通过当前可用的各种系统进行,例如但不限于

如本文所用,术语“珠粒”通常是指颗粒。珠粒可以是固体或半固体颗粒。珠粒可以是凝胶珠粒。凝胶珠粒可包括聚合物基质(例如,通过聚合或交联形成的基质)。聚合物基质可包括一种或多种聚合物(例如,具有不同官能团或重复单元的聚合物)。聚合物基质中的聚合物可无规排列,例如在无规共聚物中,和/或具有有序结构,例如在嵌段共聚物中。交联可经由共价、离子或诱导的相互作用或物理缠结进行。珠粒可以是大分子。珠粒可由结合在一起的核酸分子形成。可经由分子(例如大分子)例如单体或聚合物的共价或非共价组装形成珠粒。这样的聚合物或单体可以是天然的或合成的。这样的聚合物或单体可以是或包括例如核酸分子(例如,DNA或RNA)。珠粒可由聚合物材料形成。珠粒可以是磁性的或非磁性的。珠粒可以是刚性的。珠粒可以是柔性的和/或可压缩的。珠粒可以是可破坏的或可溶解的。珠粒可以是覆盖有包含一种或多种聚合物的涂层的固体颗粒(例如,包括但不限于氧化铁、金或银的金属基颗粒)。所述涂层可以是可破坏的或可溶解的。

术语“珠粒”、“凝胶珠粒”和“合成细胞”在本文中可互换使用,并且通常是指可模拟细胞的颗粒。这样的颗粒可以是珠粒,例如凝胶珠粒。珠粒可在尺寸、形状等方面类似于细胞,例如生物样品的细胞。珠粒可以是对照珠粒或条形码珠粒。对照珠粒可在结构上类似于条形码珠粒。例如,在对照珠粒中,条形码珠粒的至少一些条形码序列可被对照序列(例如,诸如基因的核酸序列)代替。对照和/或条形码珠粒的这种模块化设计可能是有利的,并且简化了这些珠粒的生产和/或质量控制。

如本文所用,术语“样品”通常是指受试者的生物样品。生物样品可包含任何数量的大分子,例如细胞大分子。样品可以是细胞样品。样品可以是细胞系或细胞培养物样品。样品可包括一个或多个细胞。样品可包括一种或多种微生物。生物样品可以是核酸样品或蛋白质样品。生物样品也可以是碳水化合物样品或脂质样品。生物样品可源自另一样品。样品可以是组织样品,例如活检、核心活检、针抽吸物或细针抽吸物。样品可以是流体样品,例如血液样品、尿液样品或唾液样品。样品可以是皮肤样品。样品可以是脸颊拭子。样品可以是血浆或血清样品。样品可以是无细胞或不含细胞的样品。无细胞样品可包括细胞外多核苷酸。可从身体样品中分离细胞外多核苷酸,所述身体样品可选自由以下组成的组:血液、血浆、血清、尿液、唾液、粘膜排泄物、痰液、粪便和泪液。

如本文所用,术语“分析物载体”通常是指源自生物样品的离散的生物系统。分析物载体可以是大分子。分析物载体可以是小分子。分析物载体可以是生物颗粒。分析物载体可以是病毒。分析物载体可以是细胞或细胞衍生物。分析物载体可以是细胞器。分析物载体可以是来自细胞群体的稀有细胞。分析物载体可以是任何类型的细胞,包括但不限于原核细胞,真核细胞,细菌、真菌、植物、哺乳动物(例如,来自人类和/或小鼠),或其它动物细胞类型,支原体,正常组织细胞,肿瘤细胞或任何其它细胞类型,无论是源自单细胞还是多细胞生物。分析物载体可以是细胞的成分。分析物载体可以是或可包括DNA、RNA、细胞器、蛋白质或其任何组合。分析物载体可以是或可包括基质(例如,凝胶或聚合物基质),其包含细胞或来自细胞(例如细胞珠粒)的一种或多种组分,例如来自细胞的DNA、RNA、细胞器、蛋白质或其任何组合。分析物载体可获自受试者的组织。分析物载体可以是硬化的细胞。这种硬化的细胞可包括或可不包括细胞壁或细胞膜。分析物载体可包括细胞的一种或多种成分,但是可不包括细胞的其它成分。这种成分的一个实例是细胞核或细胞器。细胞可以是活细胞。活细胞可能能够被培养,例如,当被封闭在凝胶或聚合物基质中时被培养,或者当包含凝胶或聚合物基质时被培养。

如本文所用,术语“大分子成分”通常是指包含在分析物载体内或来自分析物载体的大分子。大分子成分可包含核酸。在一些情况下,分析物载体可以是大分子。大分子成分可包含DNA。大分子成分可包含RNA。RNA可以是编码的或非编码的。RNA可以是例如信使RNA(mRNA)、核糖体RNA(rRNA)或转移RNA(tRNA)。RNA可以是转录物。RNA可以是长度小于200个核酸碱基的小RNA,或长度大于200个核酸碱基的大RNA。小RNA可包括5.8S核糖体RNA(rRNA)、5S rRNA、转移RNA(tRNA)、微RNA(miRNA)、小干扰RNA(siRNA)、小核仁RNA(snoRNA)、Piwi相互作用RNA(piRNA)、tRNA衍生的小RNA(tsRNA)和小rDNA衍生的RNA(srRNA)。RNA可以是双链RNA或单链RNA。RNA可以是环状RNA。大分子成分可包含蛋白质。大分子成分可包含肽。大分子成分可包含多肽。

如本文所用,术语“分子标签”通常是指能够结合大分子成分的分子。分子标签可以高亲和力结合至大分子成分。分子标签可以高特异性结合至大分子成分。分子标签可包含核苷酸序列。分子标签可包含核酸序列。核酸序列可以是分子标签的至少一部分或全部。分子标签可以是核酸分子或可以是核酸分子的一部分。分子标签可以是寡核苷酸或多肽。分子标签可包含DNA适体。分子标签可以是或包含引物。分子标签可以是或包含蛋白质。分子标签可包含多肽。分子标签可以是条形码。

如本文所用,术语“分区”通常是指可能适合包含一种或多种物质或进行一种或多种反应的空间或体积。分区可以是物理隔室,例如液滴或孔。分区可将空间或体积与另一个空间或体积隔离。液滴可以是与第一相不混溶的第二相(例如油)中的第一相(例如水相)。液滴可以是不与第一相发生相分离的第二相中的第一相,例如水相中的胶囊或脂质体。分区可包括一个或多个其它(内部)分区。在一些情况下,分区可以是可由跨多个和/或远程物理隔室的索引(例如索引文库)来定义和标识的虚拟隔室。例如,物理隔室可包括多个虚拟隔室。

本文提供了用于分析细胞样品中的单细胞过程的系统和方法。这样的系统和方法可提供在单细胞处理实验中模拟单细胞行为的合成细胞。合成细胞可以是包含一个或多个已知序列的珠粒。例如,珠粒可包括包含已知序列的核酸分子(例如DNA、RNA等)。珠粒可与核酸分子偶联或以其它方式并入。在一些情况下,核酸分子可被珠粒捕获(例如,在基质中)。珠粒可以是凝胶珠粒。合成细胞可被引入细胞样品中并具有与细胞样品中的其它细胞大致相同或基本相同的尺寸(例如,约15微米(μm)至约60μm)。合成细胞可通过利用细胞样品进行单细胞处理实验的整个工作流进行携带。测序后,可鉴定和分析合成细胞中的一个或多个已知序列,以确定单细胞处理实验的各种特征,例如文库制备过程或测序过程的有效性或效率。

在一个方面,本公开提供了一种用于通过将一组条形码珠粒、一组对照珠粒和细胞样品分配到多个分区中来分析细胞样品中的单细胞过程的方法。用于生成分区的系统和方法在本文其它地方进行了描述,例如关于图1-7B。分区可以是乳液或其它微囊中的液滴。分区可以是实体分区,例如孔。条形码珠粒在本文其它地方进行了描述,例如关于图8。所述系统和方法可使用多于一组的对照珠粒。例如,可存在至少约2、3、4、5、6、7、8、9、10、15、20或更多组对照珠粒。可替代地,可存在至多约20、15、10、9、8、7、6、5、4、3、2或1组对照珠粒。

所述方法可包括生成包括第一分区和第二分区的多个分区。所述第一分区可包括来自细胞样品的分析物载体如细胞,和来自条形码珠粒组的第一条形码珠粒。所述分析物载体可以是或包含生物颗粒。所述分析物载体可以是或包含分析物。所述分析物载体可包括模板核酸分子。所述第一条形码珠粒可包括包含第一条形码序列的第一条形码核酸分子。所述第二分区可包括来自条形码珠粒组的第二条形码珠粒和来自对照珠粒组的第一对照珠粒。所述第二条形码珠粒可包括包含第二条形码序列的第二条形码核酸分子。所述第二条形码序列可不同于所述第一条形码序列。所述第一对照珠粒可包括包含已知序列的核酸分子。

所述方法可包括处理第一分区和第二分区以产生条形码化模板核酸分子和条形码化核酸分子。所述条形码化模板核酸分子可包含第一条形码序列以鉴定分析物载体(例如细胞)。所述条形码化核酸分子可包含第二条形码序列以鉴定已知序列。所述条形码化模板核酸分子和所述条形码化核酸分子可被测序以鉴定分析物载体和/或已知序列来分析单细胞过程。

如本文其它地方所述,在一些情况下,所述方法还可包括使用第二组对照珠粒。例如,可生成第三分区。所述第三分区包括来自条形码珠粒组的第三条形码珠粒和来自第二组对照珠粒的第二对照珠粒。所述第三条形码珠粒可包括包含第三条形码序列的第三条形码核酸分子。所述第二对照珠粒可包括包含第二已知序列的第二核酸分子。所述第二已知序列可不同于所述已知序列。所述第三分区可被处理以产生第二条形码化核酸分子。所述第二条形码化核酸分子可包含第三条形码序列以鉴定第二已知序列。除了所述条形码化模板核酸分子和所述条形码化核酸分子之外,还可对所述第二条形码化核酸分子进行测序以分析单细胞过程。

图9示出了用于对单细胞实验进行质量控制的方法。混合生物样品902和一组条形码珠粒904可被分配到多个分区906中。混合生物样品902可包含多个细胞908、多个第一对照珠粒910和多个第二对照珠粒912。条形码珠粒组904可包含多个条形码珠粒914。多个分区906中的每个分区可包含条形码珠粒和生物样品的多个细胞中的一个细胞、第一对照珠粒或第二对照珠粒。例如,一些分区916可包含条形码珠粒和细胞,一些分区918可包含条形码珠粒和第一对照珠粒,并且一些分区920可包含条形码珠粒和第二对照珠粒。应理解,如本文其它地方所述,在分区产生期间,分区可不具有颗粒(例如,珠粒、细胞等),具有一个以上的条形码珠粒或一个以上的细胞、第一对照珠粒、或第二对照珠粒,或其任何组合。系统和方法可被配置为生成大部分单独占用的分区(例如,大于50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或更高等)和/或被配置为分选出单独占用的分区以进行进一步处理。单独占用的分区可以指具有条形码珠粒之一和/或细胞或对照珠粒(例如,第一对照珠粒、第二对照珠粒)之一的那些分区。

条形码珠粒组914中的条形码珠粒(例如914)可包含条形码。携带条形码的珠粒的一个实例示于图8中。珠粒可通过可释放的键(例如二硫键接头)与核酸分子例如寡核苷酸偶联。珠粒可与一个或多个其它核酸分子偶联。每个核酸分子可以是或包含与相同珠粒偶联的所有核酸分子共有的珠粒特异性条形码序列(例如,对于每个珠粒是唯一的)。条形码可包含许多序列要素,例如珠粒特异性条形码序列,用于后续处理的功能序列(例如,流动池附接序列、测序引物序列等),引物序列(例如,聚-T序列、靶向引物序列、随机引物序列等),锚定序列(例如,随机短序列等)和/或分子特异性条形码序列。分子特异性条形码序列,也称为唯一分子标识符(UMI),即使在相同珠粒内,对于与珠粒偶联的每个核酸分子也可能是唯一的。例如,对于与成千上万或甚至数百万个单独的核酸分子偶联的条形码珠粒,每个单独的核酸分子可由UMI唯一地标识。应理解,两个或更多个UMI可重叠。例如,UMI计数纯度可测量PCR中的嵌合现象,这会在较高的测序深度下导致明显的技术噪音。有利的是,本文描述的系统和方法可确定单细胞实验的UMI纯度率。

来自多个第一对照珠粒910的第一对照珠粒可以是合成细胞,其被配置为模拟单细胞处理实验的单细胞行为,例如用于测序。第一对照珠粒可以是珠粒,例如凝胶珠粒。第一对照珠粒可具有与混合生物样品902中的多个细胞908的平均尺寸大致相同或基本相同的尺寸。例如,第一对照珠粒的直径可为约15微米(μm)至约25μm。可替代地或另外地,第一对照珠粒的直径可为至少约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65μm或更大。可替代地或另外地,第一对照珠粒的直径可为至多约65、60、55、50、45、40、35、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10μm或更小。在一些情况下,第一对照珠粒的尺寸(例如直径)可与混合细胞样品中的细胞的平均尺寸(例如直径)相差至少约90%、80%、70%、60%、50%、40%、30%、25%、20%、15%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更低以内。可替代地或另外地,第一对照珠粒可具有模拟单细胞的其它物理特征或性质,例如密度、质量、形状等。可替代地或另外地,第一对照珠粒可具有模拟单细胞的其它特征或性质,例如化学性质,例如电导率、硬度、可变形性、与水溶液或非水溶液的相互作用性质等。在一些情况下,第一对照珠粒可具有模拟单细胞的光学性质,例如用流式细胞术可辨别的那些(例如,前向或侧向散射)。

第一对照珠粒可包括第一组的一个或多个已知序列。例如,珠粒可包括包含已知序列的核酸分子(例如DNA、RNA等)。第一对照珠粒可包括包含已知序列的任何其它分析物(例如蛋白质、代谢物、核酸分子等)。在一些情况下,珠粒可与核酸分子(或其它分析物)偶联或以其它方式并入。例如,珠粒可以可释放地偶联至核酸分子,例如通过接头或通过本文其它地方描述的其它方法。在一些情况下,可使用如本文其它地方所述的点击化学将珠粒偶联或附接至核酸分子。在一些情况下,核酸分子(或其它分析物)可被珠粒捕获(例如,在聚合物基质中)。第一对照珠粒可包括任何数量的已知序列。例如,第一珠粒对照珠粒可包括至少约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、96或100或更多个已知序列。可替代地或另外地,第一珠粒对照珠粒可包括至多约100、96、95、90、85、80、75、70、65、60、55、50、45、40、35、30、25、20、15、10、9、8、7、6、5、4、3、2或1个已知序列。第一对照珠粒可包含许多分析物(例如核酸分子)和/或不同分析物(例如核酸分子)的任何组合。在一个实例中,第一对照珠粒可包括包含第一已知序列的第一DNA分子,包含第二已知序列的第二DNA分子和包含第三已知序列的RNA分子。第一对照珠粒可包括一种或多种不包含已知序列的另外的分析物。例如,这样的分析物可允许第一对照珠粒模拟单细胞行为。

来自多个第二对照珠粒912的第二对照珠粒可以是另一种合成细胞,例如关于第一对照珠粒所述。第二对照珠粒可包括第二组的一个或多个已知序列。例如,珠粒可包括包含已知序列的核酸分子(例如DNA、RNA等)或其它分析物(例如蛋白质、代谢物、核酸分子等)。在一些情况下,第二对照珠粒可与核酸分子(或其它分析物)偶联或以其它方式并入。例如,第二对照珠粒可以可释放地与核酸分子偶联,例如通过接头或通过本文其它地方描述的其它方法。在一些情况下,可使用如本文其它地方所述的点击化学将珠粒偶联或附接至核酸分子。在一些情况下,核酸分子(或其它分析物)可被珠粒捕获(例如,在聚合物基质中)。第二对照珠粒可包括任何数量的已知序列。例如,第二对照珠粒可包括至少约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、96、100或更多个已知序列。可替代地或另外地,第二对照珠粒可包含至多约100、96、95、90、85、80、75、70、65、60、55、50、45、40、35、30、25、20、15、10、9、8、7、6、5、4、3、2或1个已知序列。第二对照珠粒可包含许多分析物(例如核酸分子)和/或不同分析物(例如核酸分子)的任何组合。在一个实例中,第二对照珠粒可包括包含第一已知序列的第一DNA分子、包含第二已知序列的第二DNA分子和包含第三已知序列的RNA分子。第二对照珠粒可包括一种或多种不包含已知序列的另外的分析物。例如,这样的分析物可允许第二对照珠粒模拟单细胞行为。

第一对照珠粒中的第一组已知序列可不同于第二对照珠粒中的第二组已知序列。例如,它们可以是互斥的,使得第二对照珠粒中的一个或多个已知序列中的任何一个都不与第一对照珠粒中的一个或多个已知序列中的任何一个重叠。在一些情况下,第一组已知序列中的至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或更多的转录物可与第二组已知序列分离并且可从第二组已知序列中独立地分类。可替代地或另外地,第一组已知序列中的至多约99.9%、99.5%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%或更少的转录物可与第二组已知序列分离并且可从第二组已知序列中独立地分类。在其它情况下,可能存在一个或多个重叠的已知序列。

在一些情况下,每组已知序列可包括唯一的一组序列。例如,所述唯一的一组序列可在长度、浓度和/或GC含量上变化。

在一些情况下,已知序列可以是合成的。在其它情况下,已知序列可源自生物样品。可替代地或另外地,已知序列可以是合成的和生物源序列的组合。在一些情况下,第一对照珠粒的第一组已知序列可源自第一物种(例如,来自人类的纯化的基因组DNA),并且第二对照珠粒的第二组已知序列可源自第二物种(例如,来自小鼠的纯化的基因组DNA)。在一些情况下,对照珠粒中使用的已知序列的来源可能会有所不同,取决于单细胞应用的类型,要确定的参数类型(例如,UMI计数纯度、双重峰率等)和/或确定方法。例如,实验室可使用容易获得的、充分表征的细胞系来提供已知序列作为对照。但是,取决于各种生物学因素,使用此类对照可能会产生可变的结果,并且可能难以(或在一些情况下不可能)计算双重峰率或UMI纯度。在另一个实施例中,第一组已知序列可源自第一人类供体的外周血单核细胞(PBMC),第二组已知序列可源自第二人类供体的PBMC,并且可分析单核苷酸多态性(SNP)来确定双重峰率,而不是UMI纯度。在另一个实例中,第一组已知序列可源自女性人类的外周血单核细胞(PBMC),第二组已知序列可源自男性人类的PBMC,并且可分析Y染色体以确定双重峰率,而不是UMI纯度。

所述系统和方法可包括多个第一对照珠粒910的数量或浓度与多个第二对照珠粒912的任何比率。例如,所述比率可以是1:1。可替代地或另外地,所述比率可为至少约1:0.001、1:0.01、1:0.1、1:0.2、1:0.3、1:0.4、1:0.5、1:0.6、1:0.7、1:0.8、1:0.9、1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90、1:100、1:1000或更大。可替代地或另外地,所述比率可为至多约1:1000、1:100、1:90、1:80、1:70、1:60、1:50、1:40、1:30、1:20、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1.9、1:1.8、1:1.7、1:1.6、1:1.5、1:1.4、1:1.3、1:1.2、1:1.1、1:1、1:0.9、1:0.8、1:0.7、1:0.6、1:0.5、1:0.4、1:0.3、1:0.2、1:0.1、1:0.01、1:0.001或更小。

本文其它地方详细描述了产生珠粒的方法。对照珠粒可产生为凝胶珠粒,例如,将一个或多个包含已知序列的核酸分子包封在对照珠粒中。例如,可将包含已知序列的核酸分子添加到起始试剂混合物中(例如,代替acrydite引物)。可将对照珠粒配置为具有较小的孔径,例如通过增加交联剂浓度。例如,孔可防止DNA分子、RNA分子或其它分析物逸出对照珠粒。在操作中,对照珠粒可被包装到已知浓度的适当缓冲液中,并以一次性使用的等分试样形式储存。对照珠粒可在环境温度下储存。对照珠粒可在室温下储存。在一些情况下,对照珠粒可在约-80摄氏度(℃)下储存。可替代地或另外地,对照珠粒可在至多约25℃、24℃、23℃、22℃、21℃、20℃、19℃、18℃、17℃、16℃、15℃、14℃、13℃、12℃、11℃、10℃、9℃、8℃、7℃、6℃、5℃、4℃、3℃、2℃、1℃、0℃、-5℃、-10℃、-15℃、-20℃、-25℃、-30℃、-35℃、-40℃、-45℃、-50℃、-55℃、-60℃、-65℃、-70℃、-75℃、-80℃或更低的温度下储存(或以其它方式暴露于所述温度)。在一些情况下,对照珠粒可在大于约25℃的温度下储存(或以其它方式暴露于所述温度)。

可替代地或另外地,本公开的对照珠粒可作为非凝胶珠粒如聚苯乙烯珠粒生成,其包封一个或多个包含已知序列的核酸分子。

在操作中,如图9所示,可将多个第一对照珠粒910和多个第二对照珠粒912引入包含多个细胞908的细胞样品中,以产生混合细胞样品902。可将任何数量的每种类型的对照珠粒引入细胞样品中。例如,可引入至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、200、300、400、500、600、700、800或更多个对照珠粒。可替代地或另外地,可将至多约800、700、600、500、400、300、200、150、140、130、120、110、100、90、80、70、60、50、40、30、20、10、9、8、7、6、5、4、3、2或1个对照珠粒引入细胞样品中。可替代地或另外地,混合细胞样品中的第一对照珠粒和/或第二对照珠粒的第一浓度与细胞的第二浓度的比率可为至少约1:1000、1:100、1:90、1:80、1:70、1:60、1:50、1:40、1:30、1:20、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1.9、1:1.8、1:1.7、1:1.6、1:1.5、1:1.4、1:1.3、1:1.2、1:1.1、1:1、1:0.9、1:0.8、1:0.7、1:0.6、1:0.5、1:0.4、1:0.3、1:0.2、1:0.1、1:0.01、1:0.001或更高。可替代地或另外地,所述比率可为至多约1:0.001、1:0.01、1:0.1、1:0.2、1:0.3、1:0.4、1:0.5、1:0.6、1:0.7、1:0.8、1:0.9、1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90、1:100、1:1000或更小。混合细胞样品902可与条形码珠粒组904分区以产生多个分区906。多个分区906中的每个分区可包括条形码珠粒以及细胞、第一对照珠粒或第二对照珠粒中的一者。例如,一些分区916可包括条形码珠粒和细胞,一些分区918可包括条形码珠粒和第一对照珠粒,并且一些分区920可包括条形码珠粒和第二对照珠粒。可从多个分区906创建文库并测序。

例如,在第一分区(例如916)中,第一细胞(例如908)与第一条形码珠粒(例如914)共分区。第一条形码珠粒可包含一个或多个条形码核酸分子,每个单独的条形码核酸分子(i)共享共同的珠粒特异性的第一条形码序列,以及(ii)具有不同的唯一分子标识符(UMI)。在一些情况下,第一细胞可在分区中裂解(例如,经由与裂解剂共分区)以释放一种或多种分析物载体。一种或多种分析物载体可包含模板核酸分子,例如DNA、RNA等。在分区中,条形码核酸分子可从第一条形码珠粒释放以与分析物载体杂交。举例来说,在分析物载体是mRNA分子的情况下,条形码核酸分子的聚-T区段可与mRNA分子的聚-A尾杂交以产生条形码化mRNA分子。来自第一细胞的每种分析物载体可与不同的条形码核酸分子杂交,从而每个都由第一条形码序列和不同的UMI标记。例如,可产生条形码化模板核酸分子。

在第二分区(例如918)中,第一对照珠粒(例如910)与第二条形码珠粒(例如914)共分区。第二条形码珠粒可包括一个或多个条形码核酸分子,每个单独的条形码核酸分子(i)共享共同的珠粒特异性的第二条形码序列,以及(ii)具有不同的唯一分子标识符(UMI)。第一对照珠粒可包括多个分析物载体。举例来说,分析物载体可包括具有第一已知序列的第一核酸分子和具有第二已知序列的第二核酸分子。在一些情况下,可刺激第一对照珠粒以从第一对照珠粒释放第一核酸分子和第二核酸分子。在分区中,条形码核酸分子可从第二条形码珠粒释放以与第一对照珠粒的分析物载体杂交并产生条形码化核酸分子。来自第一对照珠粒的每种分析物载体可与不同的条形码核酸分子杂交,从而各自被第二条形码序列和不同的UMI标记。例如,可产生第一条形码化核酸分子和第二条形码化核酸分子。所述第一条形码化核酸分子可包含第一已知序列、第二条形码序列和UMI。所述第二条形码化核酸分子可包含第二已知序列、第二条形码序列和UMI。

在第三分区(例如920)中,第二对照珠粒(例如912)与第三条形码珠粒(例如914)共分区。第三条形码珠粒可包括一个或多个条形码核酸分子,每个单独的条形码核酸分子(i)共享共同的珠粒特异性的第三条形码序列,以及(ii)具有不同的唯一分子标识符(UMI)。第二对照珠粒可包括多个分析物载体。举例来说,分析物载体可包含具有第三已知序列的第三核酸分子和具有第四已知序列的第四核酸分子。在一些情况下,可刺激第二对照珠粒以从第二对照珠粒释放第三核酸分子和第四核酸分子。在分区中,条形码核酸分子可从第三条形码珠粒释放以与第二对照珠粒的分析物载体杂交并产生条形码化核酸分子。来自第二对照珠粒的每个分析物载体可与不同的条形码核酸分子杂交,从而各自被第三条形码序列和不同的UMI标记。例如,可产生第三条形码化核酸分子和第四条形码化核酸分子。所述第三条形码化核酸分子可包含第三已知序列、第三条形码序列和UMI。所述第四条形码化核酸分子可包含第四已知序列、第三条形码序列和UMI。

来自多个分区906的条形码化核酸分子可被测序。在上述实例中,根据测序结果,可鉴定第一条形码序列以鉴定第一细胞,可鉴定第二条形码序列以鉴定第一对照珠粒,并且可鉴定第三条形码序列以鉴定第二对照珠粒。根据测序结果,可鉴定第一已知序列以鉴定第一核酸分子和第一对照珠粒,可鉴定第二已知序列以鉴定第二核酸分子和第一对照珠粒,可鉴定第三已知序列以鉴定第三核酸分子和第二对照珠粒,并且可鉴定第四已知序列以鉴定第四核酸分子和第二对照珠粒。

在单细胞过程期间,混合细胞样品902中的每个细胞或对照珠粒都由唯一的珠粒特异性的条形码序列进行条形码化,使得具有相同珠粒特异性条形码序列的每个分析物都可归属于相同的细胞或对照珠粒。然而,可能会出现双重峰情况,其中两个或更多个细胞和/或对照珠粒由相同的珠粒特异性序列进行条形码化。例如,在通过相同的珠粒特异性条形码序列对第一细胞和第二细胞进行条形码化的情况下,可分别源自第一细胞和第二细胞并且已经通过相同的珠粒特异性条形码序列进行条形码化的两种分析物可被错误地归属于源自相同的细胞。例如,通过珠粒组904中具有相同的珠粒特异性条形码序列的两个或更多个珠粒或者在分区将一个珠粒与两个或更多个细胞和/或对照珠粒(这是更可能的)共分区的情况下,可能引起双重峰情况。在分区920中示出了后一种情况的实例。有利的是,本文描述的系统和方法可测量双重峰率。可通过将第一对照珠粒中的已知序列(例如,第一已知序列、第二已知序列等)上的条形码序列与第二对照珠粒中的已知序列(例如,第三已知序列、第四已知序列等)上的条形码序列进行比较来测量双重峰率。任何重叠都可能指示双重峰。可至少部分地基于重叠实例的数量以及混合细胞样品902中的第一对照珠粒910和/或第二对照珠粒912的浓度来测量双重峰率。为了清楚起见,出于测量或研究双重峰率的目的,不需要存在UMI。也就是说,条形码珠粒不需要在各个条形码核酸分子上包含不同的UMI(即,它们的存在或不存在是任选的)。例如,在本文描述的系统和方法中使用的条形码珠粒可包括一个或多个条形码核酸分子,每个单独的条形码核酸分子共享共同的珠粒特异性的条形码序列。

在一些情况下,每种分析物都可通过唯一分子标识符进行条形码化。理想地,在单细胞过程期间,细胞或对照珠粒中的每个分析物都由真正唯一分子标识符进行条形码化,使得每个分析物具有不同的唯一分子标识符。有利的是,可将源自不同细胞的分析物的相同拷贝与源自扩增(例如PCR)的相同拷贝区分开。即使在给定分区的内容物的任何后续扩增之后,不同的UMI的数量也可指示源自给定分区的分析物的数量,并因此可指示源自分析物载体(例如细胞)的分析物的数量。这样的UMI计数可用于比较例如不同细胞类型或条件下每个转录物的拷贝数。然而,例如,当在单细胞过程中引入外来UMI时,UMI计数可能会出错。例如,当PCR期间存在核苷酸取代或存在核苷酸错误调用,或者在测序期间存在插入或缺失(indel)时,UMI序列可改变。例如,这样的改变可能是由PCR期间的重组事件引起的,所述重组事件产生了可改变原始UMI序列的嵌合序列。有利的是,本文描述的系统和方法可测量UMI纯度。有利的是,本文描述的系统和方法可在同一测定中测量双重峰率和UMI纯度。在以上实例中,可通过基于第一对照珠粒中的已知序列(例如,第一已知序列、第二已知序列等)将第一对照珠粒的UMI计数与预期UMI计数进行比较来测量UMI纯度。可替代地或另外地,可通过基于第二对照珠粒中的已知序列(例如,第三已知序列、第四已知序列等)将第二对照珠粒的UMI计数与预期UMI计数进行比较来测量UMI纯度。UMI纯度可至少部分地基于混合细胞样品902中的第一对照珠粒910和/或第二对照珠粒912的浓度来测量。

如本文其它地方所述,所述系统和方法可使用任何数量的类型的对照珠粒。例如,可存在至少约2、3、4、5、6、7、8、9、10、15、20或更多组对照珠粒。可替代地,可存在至多约20、15、10、9、8、7、6、5、4、3、2或1组对照珠粒。这样的多组对照珠粒可以任何比率引入细胞样品中。

本文描述的系统和方法可用于对任何单细胞测定或其过程例如分区过程、条形码化过程、扩增过程、文库创建和测序过程以及其它过程(或其组合)进行质量控制。

在一些情况下,对照珠粒可被配置为模拟不同的分析物。例如,本公开的对照珠粒可被配置为模拟含有细胞的细胞珠粒,以利用细胞珠粒来分析单细胞应用。细胞珠粒在本文其它地方进行了详细描述,例如关于图1。例如,对照珠粒的直径可为约54μm以模拟细胞珠粒。可替代地或另外地,对照珠粒的直径可为至少约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65μm或更大。可替代地或另外地,对照珠粒的直径可为至多约65、60、55、50、45、40、35、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10μm或更小。在一些情况下,对照珠粒的尺寸(例如直径)可能与混合细胞珠粒样品(例如,混合多个细胞珠粒与一个或多个对照珠粒)中的细胞珠粒的平均尺寸(例如直径)相差在至少约90%、80%、70%、60%、50%、40%、30%、25%、20%、15%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更低以内。可替代地或另外地,对照珠粒可具有模拟细胞珠粒的其它物理特征或性质,例如密度、质量、形状等。对照珠粒可具有模拟细胞珠粒的其它特征或性质,例如化学性质,例如电导率、硬度、大小、形状、密度、疏水性和/或与水溶液或非水溶液的相互作用性质等。在操作中,可将对照珠粒引入细胞珠粒样品中,并且可对混合细胞珠粒样品进行单细胞应用或测定。可在单细胞应用或测定期间或之后追踪对照珠粒或其已知序列以用于分析。

在一些情况下,对照珠粒可被配置为模拟或包含染色质。例如,可产生(例如,合成的或生物源的)核酸片段以具有限定的蛋白质结合位点以及开放节段。对照珠粒可包含蛋白质-DNA分子复合物,其中所述复合物中的DNA分子包含已知序列。所述已知序列可包含限定的蛋白质结合位点。对照珠粒可与包含蛋白质-DNA分子复合物的其它分析物混合以用于单细胞应用,例如转座酶可及染色质测定(ATAC-seq)。对照珠粒可被配置为模拟或包含任何其它分析物(例如细胞、细胞珠粒、染色质、核酸分子、蛋白质、另一分子、复合物等),以用作其它单细胞应用中的对照。可在单细胞应用或测定期间或之后追踪对照珠粒或其已知序列以用于分析。

本公开提供了与本文描述的方法和系统一起使用的试剂盒。试剂盒可包括一组对照珠粒。所述对照珠粒组可以是本文其它地方描述的任何对照珠粒组。例如,所述对照珠粒组可被配置为模拟细胞、细胞珠粒或其它分析物。所述试剂盒可包括在对照珠粒组中包含已知核酸序列组的索引。例如,所述索引可以是已知核酸序列的列表。在一些情况下,索引可包括每个已知序列的浓度。在一些情况下,索引可包括缓冲液中的对照珠粒组的浓度。在一些情况下,索引可包括试剂盒中包括的任何其它试剂的浓度。试剂盒可包括执行本文所述方法所必需的试剂和缓冲液。例如,试剂盒可包括用于测序测定的用于样品制备的试剂和缓冲液和/或用于执行本文所述的一种或多种测序测定的试剂和缓冲液。

试剂盒可包含任何数量的对照珠粒组,例如本文其它地方所述。例如,试剂盒可包含至少约2、3、4、5、6、7、8、9、10、20、30、40、50或更多组对照珠粒。可替代地或另外地,试剂盒可包含至多约50、40、30、20、10、9、8、7、6、5、4、3、2或1组对照珠粒。可以任何比率(例如以1:2的比率)在试剂盒中使用这样的对照珠粒组(或亚组)。索引可包括试剂盒中包括的每组对照珠粒的已知核酸序列组。索引可包括每个已知序列的浓度。索引可包括在相应缓冲液中每组对照珠粒的浓度。

试剂盒可包括详述本文描述的系统和方法的一个或多个过程的说明书。试剂盒可包括可被分隔以容纳一个或多个容器(例如小瓶、管等)的载体、包装或容器,每个容器均包括分开的元件之一,例如核酸探针和缓冲液,以用于本文所述的方法中。合适的容器包括例如瓶、小瓶、注射器和试管。容器可由多种材料例如玻璃或塑料形成。试剂盒可包括以上的任何组合。试剂盒可包括以上所有。

本文提供的制品包含包装材料。包装材料的实例包括但不限于瓶、管、袋、容器或瓶。试剂盒可包括列出试剂盒内容物和/或使用说明书的标签,以及带有使用说明书的包装插页。也可包括一组说明书。所述说明书可以是物理或数字格式(例如,可包括在小册子中或存储在计算机存储器中的说明书)。

在一个方面,本文描述的系统和方法提供了将一个或多个颗粒(例如,分析物载体、分析物载体的大分子成分、珠粒、试剂等)分隔、沉积或分配到离散的隔室或分区(本文中可互换地称为分区)中,其中每个分区保持其自身内容物与其它分区的内容物隔离。分区可以是乳液中的液滴。分区可包括一个或多个其它分区。

分区可包括一个或多个颗粒。分区可包括一种或多种类型的颗粒。例如,本公开的分区可包含一种或多种分析物载体和/或其大分子成分。分区可包含一个或多个凝胶珠粒。分区可包含一个或多个细胞珠粒。分区可包括单个凝胶珠粒、单个细胞珠粒、或者单个细胞珠粒和单个凝胶珠粒两者。分区可包括一种或多种试剂。可替代地,分区可不被占用。例如,分区可能不包含珠粒。细胞珠粒可以是分析物载体和/或一种或多种包封在凝胶或聚合物基质内部的大分子成分,例如经由使包含分析物载体和能够聚合或胶凝的前体的液滴聚合。如本文其它地方所述,可在液滴产生之前、之后或与之同时将例如条形码的唯一标识符注入液滴中,例如经由微囊(例如珠粒)。微流体通道网络(例如,在芯片上)可用于产生如本文所述的分区。在各个分析物载体的分区过程中也可采用替代机制,包括多孔膜,细胞的含水混合物通过所述多孔膜被挤出为非水流体。

分区可在流体流中流动。分区可包括例如微囊泡,其具有围绕内部流体中心或核心的外部屏障。在一些情况下,分区可包括能够将材料夹带和/或保持在其基质内的多孔基质。分区可以是第二相内的第一相的液滴,其中所述第一相和所述第二相是不混溶的。例如,分区可以是在非水连续相(例如油相)内的水性流体的液滴。在另一个实例中,分区可以是水相内的非水流体的液滴。在一些实例中,分区可以油包水乳液或水包油乳液的形式提供。多种不同的容器在例如美国专利申请公开第2014/0155295号中进行了描述,所述美国专利申请公开出于所有目的通过引用整体并入本文中。在例如美国专利申请公开第2010/0105112号中描述了用于在非水或油连续相中产生稳定液滴的乳液系统,所述美国专利申请公开出于所有目的通过引用整体并入本文中。

在乳液中的液滴的情况下,在一个非限制性实例中,可通过将水性流体中的颗粒流动流引入非水性流体的流动流中来实现将单个颗粒分配至不连续的分区,使得在两个流的交汇处生成液滴。可调节流体特性(例如,流体流速、流体粘度等)、颗粒特性(例如,体积分数、颗粒尺寸、颗粒浓度等)、微流体架构(例如,通道几何形状等)以及其它参数以控制所产生分区的占用率(例如,每个分区的分析物载体的数量、每个分区的珠粒的数量等)。例如,可通过以颗粒的特定浓度和/或流速提供水流来控制分区占用率。为了产生单个分析物载体分区,可选择不混溶流体的相对流速,使得所述分区的每个分区平均可包含少于一个分析物载体,以确保被占用的那些分区主要被单独占用。在一些情况下,多个分区中的分区可包含至多一个分析物载体(例如,珠粒、DNA、细胞或细胞材料)。在一些实施方案中,可选择或调节各种参数(例如,流体性质、颗粒性质、微流体架构等),使得大多数分区被占用,例如,仅允许小百分比的未占用分区。可控制流动和通道架构,以确保给定数量的单独占用分区、小于特定水平的未占用分区和/或小于特定水平的多重占用分区。

图1示出了用于对各个分析物载体进行分区的微流体通道结构100的一个实例。通道结构100可包括在通道接合部110处连通的通道区段102、104、106和108。在操作中,可将包括悬浮的分析物载体(或细胞)114的第一水性流体112沿着通道区段102输送到接合部110中,而与水性流体112不混溶的第二流体116从通道区段104和106中的每一者递送至接合部110,以产生第一水性流体112的离散液滴118、120,所述离散液滴流入通道区段108并从接合部110流走。通道区段108可流体耦合至出口贮器,离散的液滴可储存和/或收获在所述出口贮器中。所产生的离散液滴可包括单独的分析物载体114(例如液滴118)。所产生的离散液滴可包括一个以上的单个分析物载体114(图1中未示出)。离散的液滴可不含分析物载体114(例如液滴120)。每个离散分区可保持其自身内容物(例如,单独的分析物载体114)与其它分区的内容物的隔离。

第二流体116可包含油,例如氟化油,其包括用于稳定所得液滴的含氟表面活性剂,例如,抑制所得液滴118、120的后续聚结。例如在美国专利申请公开第2010/0105112号中描述了特别有用的分区流体和含氟表面活性剂的实例,所述美国专利申请公开出于所有目的通过引用整体并入本文中。

应理解,本文所述的通道区段可耦合至各种不同的流体源或接收组件中的任何一者,包括贮器、管道、歧管或其它系统的流体组件。应理解,微流体通道结构100可具有其它几何形状。例如,微流体通道结构可具有一个以上的通道接合部。例如,微流体通道结构可具有2、3、4或5个通道区段,每个通道区段携带在通道接合部处相遇的颗粒(例如,分析物载体、细胞珠粒和/或凝胶珠粒)。可引导流体沿着一个或多个通道或贮器经由一个或多个流体流动单元流动。流体流动单元可包括压缩机(例如,提供正压)、泵(例如,提供负压)、致动器等以控制流体的流动。也可或另外经由施加的压差、离心力、电动泵送、真空、毛细管或重力流等来控制流体。

所产生的液滴可包括液滴的两个亚组:(1)包含一个或多个分析物载体114的被占用液滴118,以及(2)不含任何分析物载体114的未占用液滴120。被占用液滴118可包括单独占用的液滴(具有一个分析物载体)和多重占用的液滴(具有一个以上分析物载体)。如本文其它地方所述,在一些情况下,大多数被占用分区的每个被占用分区可包括不超过一个的分析物载体,并且一些生成的分区可以未被占用(未被任何分析物载体占用)。但是,在一些情况下,一些被占用分区可包含一个以上的分析物载体。在一些情况下,可控制分区过程,以使得少于约25%的被占用分区含有一个以上的分析物载体,并且在许多情况下,少于约20%的被占用分区具有一个以上的分析物载体,而在一些情况下,少于约10%或甚至少于约5%的被占用分区的每个分区包含一个以上的分析物载体。

在一些情况下,可能希望最大程度地减少过多数量的空分区的产生,例如以降低成本和/或提高效率。尽管可通过在分区接合部110处提供足够数量的分析物载体(例如分析物载体114)来实现这种最小化,例如以确保至少一个分析物载体被包封在分区中,但泊松分布(Poissonian distribution)可能会出乎意料地增加包含多个分析物载体的分区数量。因而,在要获得单独占用分区的情况下,至多约95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%、5%或更少的所产生分区可能未被占用。

在一些情况下,可控制一种或多种分析物载体(例如,在通道区段102中)或引导到分区接合部(例如,在通道区段104、106中)的其它流体的流动,以使得在许多情况下,不超过约50%的所生成分区、不超过约25%的所生成分区或不超过约10%的所生成分区未被占用。可控制这些流,以呈现单独占用分区的非泊松分布,同时提供较低水平的未占用分区。可实现上述范围的未占用分区,同时仍然提供任何上述单独占用率。例如,在许多情况下,本文描述的系统和方法的使用可产生所得分区,所述分区具有小于约25%、小于约20%、小于约15%、小于约10%并且在许多情况下小于约5%的多重占用率,而具有小于约50%、小于约40%、小于约30%、小于约20%、小于约10%、小于约5%或更少的未占用分区。

应理解,上述占用率也适用于既包括分析物载体又包括另外的试剂的分区,包括但不限于携带条形码化核酸分子(例如寡核苷酸)的微囊或珠粒(例如凝胶珠粒)(关于图2描述)。被占用分区(例如,至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或99%的被占用分区)可包括同时包含条形码化核酸分子和分析物载体的微囊(例如珠粒)。

在另一方面,除了基于液滴的分区或作为基于液滴的分区的替代,分析物载体可被包封在微囊内,该微囊包括外壳、层或多孔基质,其中夹带有一个或多个单独的分析物载体或分析物载体小组。微囊可包括其它试剂。分析物载体的包封可通过多种过程来进行。这样的过程可将含有分析物载体的水性流体与聚合物前体材料结合,所述聚合物前体材料可在向聚合物前体施加特定刺激时能够形成凝胶或其它固体或半固体基质。这样的刺激可包括例如热刺激(例如,加热或冷却),光刺激(例如,通过光固化),化学刺激(例如,通过交联,前体的聚合引发(例如,通过添加的引发剂)),机械刺激或其组合。

包含分析物载体的微囊的制备可通过多种方法进行。例如,气刀液滴或气雾剂发生器可用于将前体流体的液滴分配到胶凝溶液中,以形成包括单个分析物载体或分析物载体小组的微囊。同样,基于膜的包封系统可用于产生包含如本文所述的包封的分析物载体的微囊。例如图1所示,本公开的微流体系统可容易地用于如本文所述的包封细胞。特别是,并参考图1,包含(i)分析物载体114和(ii)聚合物前体材料(未示出)的水性流体112流入通道接合部110,在此处其通过非水流体116的流动被分区成液滴118、120。在包封方法的情况下,非水流体116还可包含引发剂(未示出)以引起聚合物前体的聚合和/或交联以形成包含夹带的分析物载体的微囊。聚合物前体/引发剂对的实例包括在美国专利申请公开第2014/0378345号中描述的那些,所述美国专利申请公开出于所有目的通过引用整体并入本文中。

例如,在聚合物前体材料包括线性聚合物材料(例如线性聚丙烯酰胺、PEG或其它线性聚合物材料)的情况下,活化剂可包括交联剂或在所形成的液滴内活化交联剂的化学物质。同样,对于包含可聚合单体的聚合物前体,活化剂可包含聚合引发剂。例如,在某些情况下,在聚合物前体包含丙烯酰胺单体与N,N'-双-(丙烯酰基)胱胺(BAC)共聚单体的混合物的情况下,可在通道区段104和106中的第二流体流116内提供例如四乙基亚甲基二胺(TEMED)的试剂,它们可引发丙烯酰胺和BAC共聚成交联的聚合物网络或水凝胶。

第二流体流116与第一流体流112在接合部110处接触时,在液滴形成期间,TEMED可从第二流体116扩散到包含线性聚丙烯酰胺的水性流体112中,这将激活液滴118、120内聚丙烯酰胺的交联,导致形成凝胶(例如水凝胶)微囊,作为夹带细胞114的固体或半固体珠粒或颗粒。尽管在聚丙烯酰胺包封方面进行了描述,但在本文描述的方法和组合物的上下文中也可采用其它‘可活化的’包封组合物。例如,藻酸盐液滴的形成并接着暴露于二价金属离子(例如Ca

在一些情况下,包封的分析物载体可以可选择性地从微囊中释放,例如通过时间的流逝或在施加特定刺激时,使微囊降解足以使分析物载体(例如细胞)或其其它内容物从微囊中释放,例如释放到分区(例如液滴)中。例如,在上述聚丙烯酰胺聚合物的情况下,微囊的降解可通过引入适当的还原剂例如DTT等以裂解使聚合物基质交联的二硫键来实现。参见例如美国专利申请公开第2014/0378345号,所述美国专利申请公开出于所有目的通过引用整体并入本文中。

分析物载体可经受足以使前体聚合或胶凝的其它条件。足以使前体聚合或胶凝的条件可包括暴露于加热、冷却、电磁辐射和/或光。足以使前体聚合或胶凝的条件可包括足以使前体聚合或胶凝的任何条件。在聚合或胶凝之后,可在分析物载体周围形成聚合物或凝胶。所述聚合物或凝胶可以可扩散地渗透到化学或生化试剂。聚合物或凝胶可以可扩散地不渗透分析物载体的大分子成分。以这种方式,聚合物或凝胶可起作用以允许分析物载体经受化学或生化操作,同时将大分子成分在空间上限制在由聚合物或凝胶限定的液滴的区域中。聚合物或凝胶可包括二硫化物交联聚丙烯酰胺、琼脂糖、藻酸盐、聚乙烯醇、聚乙二醇(PEG)-二丙烯酸酯、PEG-丙烯酸酯、PEG-硫醇、PEG-叠氮化物、PEG-炔烃、其它丙烯酸酯、壳聚糖、透明质酸、胶原蛋白、纤维蛋白、明胶或弹性蛋白中的一者或多者。聚合物或凝胶可包括任何其它聚合物或凝胶。

可对聚合物或凝胶进行官能化以结合至目标分析物,例如核酸、蛋白质、碳水化合物、脂质或其它分析物。聚合物或凝胶可经由被动机理聚合或胶凝。聚合物或凝胶可在碱性条件或在高温下稳定。聚合物或凝胶的机械性能可类似于珠粒的机械性能。例如,聚合物或凝胶可具有与珠粒类似的尺寸。聚合物或凝胶可具有与珠粒类似的机械强度(例如抗张强度)。聚合物或凝胶的密度可低于油。聚合物或凝胶的密度可大致类似于缓冲剂的密度。聚合物或凝胶可具有可调的孔径。可选择孔径以例如保留变性的核酸。可选择孔径以维持对例如氢氧化钠(NaOH)的外源化学物质和/或例如抑制剂的内源化学物质的扩散渗透性。聚合物或凝胶可以是生物相容的。聚合物或凝胶可维持或增强细胞活力。聚合物或凝胶可以是生物化学相容的。聚合物或凝胶可通过热、化学、酶促和/或光学方式聚合和/或解聚。

聚合物可包含与二硫键交联的聚(丙烯酰胺-共-丙烯酸)。聚合物的制备可包括两步反应。在第一活化步骤中,可将聚(丙烯酰胺-共-丙烯酸)暴露于酰化剂以将羧酸转化成酯。例如,聚(丙烯酰胺-共-丙烯酸)可暴露于4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉鎓氯化物(DMTMM)。聚丙烯酰胺-共-丙烯酸可暴露于4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉鎓的其它盐。在第二交联步骤中,可将在第一步骤中形成的酯暴露于二硫化物交联剂。例如,所述酯可暴露于胱胺(2,2'-二硫代双(乙胺))。在所述两个步骤后,分析物载体可被通过二硫桥连接在一起的聚丙烯酰胺链包围。以这种方式,分析物载体可被包裹在凝胶或基质(例如聚合物基质)内部或包括凝胶或基质(例如聚合物基质)以形成“细胞珠粒”。细胞珠粒可含有分析物载体(例如细胞)或分析物载体的大分子成分(例如,RNA、DNA、蛋白质等)。细胞珠粒可包括单个细胞或多个细胞,或单个细胞或多个细胞的衍生物。例如,在裂解和洗涤细胞之后,可将抑制组分从细胞裂解物中洗去,并且大分子成分可结合为细胞珠粒。本文公开的系统和方法可适用于包含分析物载体的细胞珠粒(和/或液滴或其它分区)和包含分析物载体的大分子成分的细胞珠粒(和/或液滴或其它分区)。

包封的分析物载体可提供某些潜在的优势:比基于液滴的分区的分析物载体更易于储存和携带。此外,在一些情况下,可能希望允许分析物载体在分析之前温育一段选定的时间,例如以便在存在或不存在不同刺激的情况下表征此类分析物载体随时间的变化。在这些情况下,包封可比在乳液液滴中分区更长的温育时间,尽管在一些情况下,液滴分区的分析物载体也可温育不同的时间段,例如至少10秒、至少30秒、至少1分钟、至少5分钟、至少10分钟、至少30分钟、至少1小时、至少2小时、至少5小时或至少10小时或更长时间。分析物载体的包封可构成其它试剂共分区到其中的分析物载体的分区。可替代地或另外地,包封的分析物载体可容易地沉积到如上所述的其它分区(例如液滴)中。

分区可包括一个或多个唯一标识符,例如条形码。条形码可预先、随后或同时递送至容纳分隔的或分区的分析物载体的分区。例如,条形码可在液滴产生之前、之后或与之同时注入到液滴中。条形码到特定分区的递送允许稍后将各个分析物载体的特征归属于特定分区。条形码可经由任何合适的机制例如在核酸分子(例如寡核苷酸)上递送至分区。条形码化的核酸分子可经由微囊递送至分区。在一些情况下,微囊可包含珠粒。珠粒在下面进一步详细描述。

在一些情况下,条形码化的核酸分子可最初与微囊缔合,然后从微囊中释放。条形码化的核酸分子的释放可以是被动的(例如,通过扩散出微囊)。另外地或可替代地,从微囊释放可以是在施加刺激后,所述刺激允许条形码化的核酸核酸分子解离或从微囊中释放。这样的刺激可破坏微囊,将条形码化的核酸分子偶联至微囊或在微囊内的相互作用,或两者。这样的刺激可包括例如热刺激,光刺激,化学刺激(例如,pH的改变或使用还原剂),机械刺激,辐射刺激;生物刺激(例如酶),或其任何组合。

图2示出了用于将携带条形码的珠粒递送至液滴的微流体通道结构200的一个实例。通道结构200可包括在通道接合部210处连通的通道区段201、202、204、206和208。在操作中,通道区段201可将包括多个珠粒214(例如,带有核酸分子、寡核苷酸、分子标签)的水性流体212沿着通道区段201输送到接合部210中。多个珠粒214可源自珠粒的悬浮液。例如,通道区段201可连接到包含珠粒214的水性悬浮液的贮器。通道区段202可将包括多个分析物载体216的水性流体212沿着通道区段202输送到接合部210中。多个分析物载体216可源自分析物载体的悬浮液。例如,通道区段202可连接到包含分析物载体216的水性悬浮液的贮器。在一些情况下,第一通道区段201或第二通道区段202或两个区段中的水性流体212可包括一种或多种试剂,如下文进一步所述。与水性流体212不混溶的第二流体218(例如油)可从通道区段204和206中的每一者递送至接合部210。在来自通道区段201和202中的每一者的水性流体212和来自通道区段204和206中的每一者的第二流体218在通道接合部210处相遇时,水性流体212可在第二流体218中被分区为离散液滴220,并且沿着通道区段208从接合部210流走。通道区段208可将离散的液滴递送至与通道区段208流体耦合的出口贮器,在所述出口贮器中可将它们收获。

作为替代,通道区段201和202可在接合部210上游的另一个接合部处相遇。在这个接合部,珠粒和分析物载体可形成混合物,所述混合物沿着另一个通道被引导到接合部210以产生液滴220。混合物可以交替的方式提供珠粒和分析物载体,使得例如液滴包含单个珠粒和单个分析物载体。

珠粒、分析物载体和液滴可以基本上规则的流动轮廓(例如,以规则的流速)沿着通道流动。这样的规则流动轮廓可允许液滴包括单个珠粒和单个分析物载体。这样的规则流动轮廓可允许液滴具有大于5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或95%的占用率(例如,具有珠粒和分析物载体的液滴)。在例如美国专利公开第2015/0292988号中提供了这样的规则流动轮廓和可用于提供这样的规则流动轮廓的装置,所述美国专利公开通过引用整体并入本文中。

第二流体218可包含油,例如氟化油,其包括用于稳定所得液滴的含氟表面活性剂,例如,抑制所得液滴220的后续聚结。

所产生的离散液滴可包括单个分析物载体216。所产生的离散液滴可包括携带条形码或其它试剂的珠粒214。所产生的离散液滴可包括单个分析物载体和携带条形码的珠粒,例如液滴220。在一些情况下,离散液滴可包括一个以上的单个分析物载体或不包括分析物载体。在一些情况下,离散液滴可包括一个以上的珠粒或不包括珠粒。离散的液滴可能未被占用(例如,无珠粒,无分析物载体)。

有利的是,对分析物载体和携带条形码的珠粒进行分区的离散液滴可有效地允许条形码归属于分区内的分析物载体的大分子成分。分区的内容物可与其它分区的内容物保持离散。

应理解,本文所述的通道区段可耦合至多种不同的流体源或接收组件中的任何一者,包括贮器、管道、歧管或其它系统的流体组件。应理解,微流体通道结构200可具有其它几何形状。例如,微流体通道结构可具有一个以上的通道接合部。例如,微流体通道结构可具有2、3、4或5个通道区段,每个通道区段携带在通道接合部处相遇的珠粒。可引导流体沿着一个或多个通道或贮器经由一个或多个流体流动单元流动。流体流动单元可包括压缩机(例如,提供正压)、泵(例如,提供负压)、致动器等以控制流体的流动。也可或另外经由施加的压差、离心力、电动泵送、真空、毛细管或重力流等来控制流体。

珠粒可以是多孔的、无孔的、固体的、半固体的、半流体的、流体的和/或其组合。在一些情况下,珠粒可能是可溶解的,可破坏的和/或可降解的。在一些情况下,珠粒可能不可降解。在一些情况下,珠粒可以是凝胶珠粒。凝胶珠粒可以是水凝胶珠粒。凝胶珠粒可由分子前体例如聚合物或单体物质形成。半固体珠粒可以是脂质体珠粒。固体珠粒可包含金属,包括氧化铁、金和银。在一些情况下,珠粒可以是二氧化硅珠粒。在一些情况下,珠粒可以是刚性的。在其它情况下,珠粒可以是柔性的和/或可压缩的。

珠粒可具有任何合适的形状。珠粒形状的实例包括但不限于球形、非球形、椭圆形、长方形、无定形、圆形、圆柱形及其变体。

珠粒可具有一致的尺寸或非均匀的尺寸。在一些情况下,珠粒的直径可为至少约10纳米(nm)、100nm、500nm、1微米(μm)、5μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、250μm、500μm、1mm或更大。在一些情况下、珠粒的直径可小于约10nm、100nm、500nm、1μm、5μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、250μm、500μm、1mm或更小。在一些情况下,珠粒的直径可在约40-75μm、30-75μm、20-75μm、40-85μm、40-95μm、20-100μm、10-100μm、1-100μm、20-250μm或20-500μm的范围内。

在某些方面,珠粒可作为具有相对单分散的尺寸分布的珠粒群体或多个珠粒提供。在可能希望在分区内提供相对一致量的试剂的情况下,保持相对一致的珠粒特征(例如尺寸)可有助于总体一致性。特别地,本文所述的珠粒可具有这样的尺寸分布,所述尺寸分布的横截面尺寸的变化系数小于50%、小于40%、小于30%、小于20%,并且在一些情况下小于15%、小于10%、小于5%或更小。

珠粒可包含天然和/或合成材料。例如,珠粒可包含天然聚合物、合成聚合物或天然和合成聚合物两者。天然聚合物的实例包括蛋白质和糖,例如脱氧核糖核酸、橡胶、纤维素、淀粉(例如直链淀粉、支链淀粉)、蛋白质、酶、多糖、蚕丝、聚羟基链烷酸酯、壳聚糖、葡聚糖、胶原蛋白、角叉菜胶、卵叶车前子(ispaghula)、阿拉伯胶、琼脂、明胶、虫胶、刺梧桐胶、黄原胶、玉米糖胶、瓜尔胶、卡拉胶、琼脂糖、藻酸、藻酸盐或其天然聚合物。合成聚合物的实例包括丙烯酸类、尼龙、硅酮、斯潘德克斯弹性纤维(spandex)、粘胶人造丝、多元羧酸、聚乙酸乙烯酯、聚丙烯酰胺、聚丙烯酸酯、聚乙二醇、聚氨酯、聚乳酸、二氧化硅、聚苯乙烯、聚丙烯腈、聚丁二烯、聚碳酸酯、聚乙烯、聚对苯二甲酸乙二醇酯、聚(氯三氟乙烯)、聚(环氧乙烷)、聚(对苯二甲酸乙二醇酯)、聚乙烯、聚异丁烯、聚(甲基丙烯酸甲酯)、聚(亚甲氧基)、聚甲醛、聚丙烯、聚苯乙烯、聚(四氟乙烯)、聚(乙酸乙烯酯)、聚(乙烯醇)、聚(氯乙烯)、聚(偏二氯乙烯)、聚(偏二氟乙烯)、聚(氟乙烯)和/或其组合(例如共聚物)。珠粒也可由聚合物以外的材料形成,包括脂质、胶束、陶瓷、玻璃陶瓷、材料复合物、金属、其它无机材料等。

在一些情况下,珠粒可包含分子前体(例如,单体或聚合物),其可经由分子前体的聚合形成聚合物网络。在一些情况下,前体可以是已经聚合的物质,其能够经由例如化学交联进行进一步的聚合。在一些情况下,前体可包含丙烯酰胺或甲基丙烯酰胺单体、低聚物或聚合物中的一种或多种。在一些情况下,珠粒可包含预聚物,其是能够进一步聚合的低聚物。例如,聚氨酯珠粒可使用预聚物制备。在一些情况下,珠粒可含有可进一步聚合在一起的单个聚合物。在一些情况下,珠粒可经由不同前体的聚合而产生,使得它们包含混合的聚合物、共聚物和/或嵌段共聚物。在一些情况下,珠粒可在聚合物前体(例如,单体、低聚物、线性聚合物)、核酸分子(例如,寡核苷酸)、引物和其它实体之间包含共价键或离子键。在一些情况下,共价键可以是碳-碳键、硫醚键或碳-杂原子键。

取决于所使用的特定交联剂,交联可以是永久的或可逆的。可逆交联可允许聚合物在适当条件下线性化或解离。在一些情况下,可逆交联还可使结合到珠粒表面的材料可逆地附接。在一些情况下,交联剂可能形成二硫键。在一些情况下,形成二硫键的化学交联剂可以是胱胺或修饰的胱胺。

在一些情况下,可在分子前体单元(例如,单体、低聚物或线性聚合物)或掺入珠粒中的前体与核酸分子(例如寡核苷酸)之间形成二硫键。胱胺(包括修饰的胱胺)例如是一种包含二硫键的有机试剂,其可用作珠粒的各个单体或聚合前体之间的交联剂。聚丙烯酰胺可在胱胺或包含胱胺的物质(例如修饰的胱胺)的存在下聚合,以产生包含二硫键的聚丙烯酰胺凝胶珠粒(例如,包含可化学还原的交联剂的可化学降解的珠粒)。当珠粒暴露于还原剂时,二硫键可允许珠粒被降解(或溶解)。

在一些情况下,壳聚糖(一种线性多糖聚合物)可经由亲水链与戊二醛交联形成珠粒。壳聚糖聚合物的交联可通过由热、压力、pH变化和/或辐射引发的化学反应来实现。

在一些情况下,珠粒可包含acrydite部分,其在某些方面可用于将一个或多个核酸分子(例如,条形码序列、条形码化的核酸分子、条形码化的寡核苷酸、引物或其它寡核苷酸)附接至珠粒。在一些情况下,acrydite部分可以指由acrydite与一种或多种物质的反应产生的acrydite类似物,例如在聚合反应期间acrydite与其它单体和交联剂的反应。可对acrydite部分进行修饰以与要附接的物质形成化学键,所述物质例如核酸分子(例如,条形码序列、条形码化的核酸分子、条形码化的寡核苷酸、引物或其它寡核苷酸)。可通过能够形成二硫键的硫醇基团来修饰acrydite部分,或者可利用已包含二硫键的基团来修饰acrydite部分。硫醇或二硫键(经由二硫键交换)可用作要附接的物质的锚定点,或可将acrydite部分的另一部分用于附接。在一些情况下,附接可以是可逆的,使得当二硫键断裂时(例如,在还原剂的存在下),附接的物质从珠粒释放。在其它情况下,acrydite部分可包含可用于附接的反应性羟基。

可通过多种不同的方法来实现珠粒的官能化以附接核酸分子(例如寡核苷酸),所述方法包括激活聚合物内的化学基团,在聚合物结构中并入活性或可活化的官能团,或在珠粒生产中的预聚物或单体阶段进行附接。

例如,经聚合形成珠粒的前体(例如,单体、交联剂)可包含acrydite部分,使得当产生珠粒时,所述珠粒也包含acrydite部分。可将acrydite部分附接至核酸分子(例如寡核苷酸),其可包括引物序列(例如,用于扩增靶核酸的引物、随机引物、用于信使RNA的引物序列)和/或一个或多个条形码序列。一个或多个条形码序列可包括对于偶联至给定珠粒的所有核酸分子相同的序列和/或在偶联至给定珠粒的所有核酸分子上不同的序列。可将核酸分子并入珠粒中。在一些情况下,核酸分子可包含功能序列,例如用于附接至测序流动池,例如,用于

图8示出了携带条形码的珠粒的一个实例。核酸分子802,例如寡核苷酸,可通过可释放的键806(例如二硫键接头)与珠粒804偶联。相同的珠粒804可偶联(例如,经由可释放的键)到一个或多个其它核酸分子818、820。核酸分子802可以是或包括条形码。如本文其它地方所述,条形码的结构可包括多个序列元件。核酸分子802可包含可在后续处理中使用的功能序列808。例如,功能序列808可包括一个或多个测序仪特异性流动池附接序列(例如,用于

核酸分子802可包含唯一分子标识序列816(例如,唯一分子标识符(UMI))。在一些情况下,唯一分子标识序列816可包含约5至约8个核苷酸。可替代地,唯一分子标识序列816可包含少于约5个或多于约8个核苷酸。唯一分子标识序列816可以是在与单个珠粒(例如珠粒804)偶联的单个核酸分子(例如802、818、820等)之间变化的唯一序列。在一些情况下,唯一分子标识序列816可以是随机序列(例如,诸如随机N聚体序列)。例如,UMI可提供被捕获的起始mRNA分子的唯一标识符,以便允许定量原始表达的RNA的数量。应理解,尽管图8示出了与珠粒804的表面偶联的三个核酸分子802、818、820,但是单个珠粒可与任何数量的单个核酸分子偶联,例如从一个到数十个到成千上万个或甚至数百万个单独的核酸分子。单个核酸分子的相应条形码可既包含共同的序列区段,也可包含相对共同的序列区段(例如808、810、812等)以及与相同珠粒偶联的不同单个核酸分子之间的可变或唯一的序列区段(例如816)。

在操作中,可将分析物载体(例如,细胞、DNA、RNA等)与携带条形码的珠粒804一起共分区。可将条形码化的核酸分子802、818、820从分区中的珠粒804中释放。举例来说,在分析样品RNA的情况下,所释放的核酸分子之一(例如802)的聚-T区段(例如812)可与mRNA分子的聚-A尾杂交。逆转录可产生mRNA的cDNA转录物,但是所述转录物包括核酸分子802的序列区段808、810、816中的每一者。因为核酸分子802包含锚定序列814,所以它更有可能在mRNA的聚-A尾的序列末端杂交并引发逆转录。在任何给定的分区内,单个mRNA分子的所有cDNA转录物都可包括共同的条形码序列区段810。然而,由给定分区内的不同mRNA分子制成的转录物可在唯一分子标识序列812区段(例如UMI区段)处发生变化。有利的是,即使在给定分区的内容物的任何后续扩增之后,不同UMI的数量也可指示源自给定分区并因此源自分析物载体(例如细胞)的mRNA的量。如上所述,可对转录物进行扩增、纯化和测序,以鉴定mRNA的cDNA转录物的序列,以及对条形码区段和UMI区段进行测序。尽管描述了聚-T引物序列,但是其它靶向或随机引物序列也可用于引发逆转录反应。同样,尽管描述为将条形码化的寡核苷酸释放到分区中,但是在一些情况下,结合至珠粒(例如凝胶珠粒)的核酸分子可用于杂交和捕获珠粒固相上的mRNA,例如,以促进RNA与其它细胞内容物的分离。

在一些情况下,可将包含反应性或能够被活化以使其变为反应性的官能团的前体与其它前体聚合,以产生包含活化的或可活化的官能团的凝胶珠粒。然后可将官能团用于将另外的物质(例如二硫键接头、引物、其它寡核苷酸等)附接至凝胶珠粒。例如,一些包含羧酸(COOH)基团的前体可与其它前体共聚以形成还包含COOH官能团的凝胶珠粒。在一些情况下,丙烯酸(包含游离COOH基团的物质)、丙烯酰胺和双(丙烯酰基)胱胺可共聚在一起以产生包含游离COOH基团的凝胶珠粒。凝胶珠粒的COOH基团可被活化(例如,经由1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(EDC)和N-羟基琥珀酰亚胺(NHS)或4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉鎓氯化物(DMTMM)),使得它们具有反应性(例如,对其中EDC/NHS或DMTMM用于活化的胺官能团具有反应性)。然后,活化的COOH基团可与包含要与珠粒连接的部分的适当物质(例如,包含胺官能团的物质,其中羧酸基团被活化以与胺官能团反应)反应。

在其聚合物网络中包含二硫键的珠粒可经由将一些二硫键还原为游离硫醇而用其它物质官能化。可经由例如还原剂(例如,DTT、TCEP等)的作用来还原二硫键,以产生游离的硫醇基团,而不溶解珠粒。珠粒的游离硫醇然后可与物质的游离硫醇或包含另一个二硫键的物质反应(例如,经由硫醇-二硫键交换),使得所述物质可与珠粒连接(例如,经由产生的二硫键)。在一些情况下,珠粒的游离硫醇可与任何其它合适的基团反应。例如,珠粒的游离硫醇可与包含acrydite部分的物质反应。珠粒的游离硫醇基团可经由迈克尔加成(Michael addition)化学与acrydite反应,从而使包含acrydite的物质连接到珠粒上。在一些情况下,可通过包含硫醇封端剂如N-乙基马来酰胺或碘乙酸酯来防止不受控制的反应。

珠粒内二硫键的活化可被控制,使得仅少量的二硫键被活化。例如,可通过控制用于生成游离硫醇基团的还原剂的浓度和/或用于在珠粒聚合中形成二硫键的试剂的浓度来施加控制。在一些情况下,低浓度(例如,还原剂分子:凝胶珠粒的比率小于或等于约1:100,000,000,000,小于或等于约1:10,000,000,000,小于或等于约1:1,000,000,000,小于或等于约1:100,000,000,小于或等于约1:10,000,000,小于或等于约1:1,000,000,小于或等于约1:100,000,小于或等于约1:10,000)的还原剂可用于还原。控制还原为游离硫醇的二硫键的数量可用于确保官能化期间的珠粒结构完整性。在一些情况下,例如荧光染料的光学活性剂可经由珠粒的游离硫醇基团与珠粒偶联,并用于定量存在于珠粒中的游离硫醇的数量和/或跟踪珠粒。

在一些情况下,在形成凝胶珠粒后向凝胶珠粒添加多个部分可能是有利的。例如,在凝胶珠粒形成之后添加寡核苷酸(例如,条形码化的寡核苷酸)可避免链转移终止期间物质的损失,该损失可发生在聚合期间。此外,较小的前体(例如,不包含侧链基团和连接部分的单体或交联剂)可用于聚合,并且由于粘性效应而可最小程度地阻止生长的链端。在一些情况下,凝胶珠粒合成后的官能化可使要装载有潜在破坏剂(例如自由基)和/或化学环境的物质(例如寡核苷酸)的暴露最小化。在一些情况下,所生成的凝胶可具有最高临界溶解温度(UCST),其可允许温度驱动的珠粒溶胀和塌陷。这样的官能团可在随后用寡核苷酸对珠粒进行官能化期间帮助寡核苷酸(例如引物)渗透到珠粒中。产生后的官能化还可用于控制珠粒中物质的装载率,使得例如装载率的变化最小。物质装载也可以分批过程进行,使得多个珠粒可在单个批次中被所述物质官能化。

被注入或以其它方式引入分区中的珠粒可包含可释放地、可裂解地或可逆地附接的条形码。被注入或以其它方式引入分区中的珠粒可包含可活化的条形码。被注入或以其它方式引入分区中的珠粒可以是可降解的、可破坏的或可溶解的珠粒。

条形码可以可释放地、可裂解地或可逆地附接到珠粒上,使得条形码可通过条形码分子与珠粒之间的键的断裂而释放或可释放,或者通过下面的珠粒本身的降解而释放,从而允许条形码被其它试剂接近或可被其它试剂接近,或两者。在非限制性实例中,可通过还原二硫键,使用限制酶,光活化的裂解或经由其它类型的刺激(例如,化学、热、pH、酶促等)裂解和/或反应(例如本文其它地方所述)来实现裂解。可释放的条形码有时可被称为可活化的,因为它们一旦释放就可用于反应。因此,例如,可活化的条形码可通过从珠粒(或本文所述的其它合适类型的分区)释放条形码来活化。在所描述的方法和系统的上下文中还设想了其它可活化配置。

除了或替代珠粒与缔合分子(例如含有条形码的核酸分子(例如,条形码化的寡核苷酸))之间的可裂解键,珠粒可自发地或在暴露于一种或多种刺激(例如,温度变化、pH变化、暴露于特定化学物质或相、暴露于光、还原剂等)时可降解、可破坏或可溶解。在一些情况下,珠粒可能是可溶解的,使得当暴露于特定化学物质或环境变化(例如温度变化或pH变化)时,珠粒的材料组分可溶解。在一些情况下,凝胶珠粒可在高温下和/或在碱性条件下降解或溶解。在一些情况下,珠粒可能是可热降解的,使得当珠粒暴露于适当的温度变化(例如热量)时,珠粒降解。与物质(例如,核酸分子,例如条形码化的寡核苷酸)结合的珠粒的降解或溶解可导致物质从珠粒中释放。

根据上述公开内容应理解,珠粒的降解可以指结合的或夹带的物质与珠粒的解离,其中存在和不存在物理珠粒自身的结构降解。例如,珠粒的降解可涉及经由本文其它地方描述的一种或多种物质和/或方法对可裂解键的裂解。在另一个实例中,由于例如变化的化学环境,夹带的物质可通过渗透压差从珠粒释放。举例来说,由于渗透压差而引起的珠粒孔径的改变通常会发生而珠粒本身不会结构降解。在一些情况下,由于珠粒的渗透性溶胀而导致的孔径增大可允许珠粒内夹带的物质释放。在其它情况下,由于孔径收缩,珠粒的渗透性收缩可能导致珠粒更好地保留夹带的物质。

可将可降解的珠粒引入到分区中,例如乳液或孔的液滴中,使得当施加适当的刺激时,珠粒在分区内降解并且任何相缔合的物质(例如寡核苷酸)在液滴内释放。游离物质(例如,寡核苷酸、核酸分子)可与分区中包含的其它试剂相互作用。例如,可将包含胱胺并经由二硫键连接至条形码序列的聚丙烯酰胺珠粒与油包水乳液的液滴内的还原剂结合。在液滴内,还原剂会破坏各种二硫键,导致珠粒降解,并将条形码序列释放到液滴的水性内部环境中。在另一个实例中,在碱性溶液中加热包含结合有珠粒的条形码序列的液滴也可能导致珠粒降解并且将附接的条形码序列释放到液滴的水性内部环境中。

任何合适数量的分子标签分子(例如,引物、条形码化的寡核苷酸)都可与珠粒相缔合,使得在从珠粒上释放出来后,分子标签分子(例如,引物,例如条形码化的寡核苷酸)以预定浓度存在于分区中。可选择这样的预定浓度以促进某些反应以在分区内产生测序文库,例如扩增。在一些情况下,引物的预定浓度可通过产生携带珠粒的核酸分子(例如寡核苷酸)的过程来限制。

在一些情况下,珠粒可非共价地装载一种或多种试剂。可通过例如使珠粒经受足以使珠粒溶胀的条件,从而使试剂有足够的时间扩散到珠粒内部中以及使珠粒经受足以使珠粒解溶胀的条件来非共价地装载珠粒。珠粒的溶胀可例如通过将珠粒置于热力学上有利的溶剂中,使珠粒经受更高或更低的温度,使珠粒经受更高或更低的离子浓度和/或使珠粒经受电场来实现。珠粒的溶胀可通过各种溶胀方法来完成。珠粒的解溶胀可例如通过以下方式实现:将珠粒转移到热力学不利的溶剂中,使珠粒经受较低或较高的温度,使珠粒经受较低或较高的离子浓度,和/或除去电场。珠粒的解溶胀可通过各种解溶胀方法来实现。转移珠粒可能会导致珠粒中的孔收缩。收缩然后可能阻碍珠粒内的试剂扩散出珠粒内部。阻碍可能是由于试剂与珠粒内部之间的空间相互作用。转移可以微流体方式实现。例如,可通过将珠粒从一种共同流动的溶剂流移至另一种共同流动的溶剂流来实现转移。珠粒的可溶胀性和/或孔径可通过改变珠粒的聚合物组成来调节。

在一些情况下,连接至前体的acrydite部分、连接至前体的另一物质或前体本身可包含不稳定键,例如化学敏感、热敏感或光敏感的键例如二硫键,UV敏感键等。一旦acrydite部分或其它包含不稳定键的部分被并入到珠粒中,所述珠粒也可包含不稳定键。不稳定键可例如用于将物质(例如,条形码、引物等)可逆地连接(例如共价连接)至珠粒。在一些情况下,热不稳定键可包括基于核酸杂交的附接,例如,其中寡核苷酸与附接至珠粒的互补序列杂交,从而使得杂交体的热熔从珠粒或微囊释放出寡核苷酸,例如含条形码的序列。

向凝胶珠粒上添加多种类型的不稳定键可能会导致生成能够对各种刺激做出反应的珠粒。每种类型的不稳定键可能对相关的刺激(例如,化学刺激、光、温度、酶促等)敏感,使得经由每个不稳定键附接至珠粒上的物质的释放可通过施加适当的刺激来控制。这样的官能团可用于从凝胶珠粒中控制释放物质。在一些情况下,包含不稳定键的另一种物质可在形成凝胶珠粒之后经由例如如上所述的凝胶珠粒的活化官能团与凝胶珠粒连接。应理解,可释放地、可裂解地或可逆地附接至本文所述的珠粒上的条形码包括通过条形码分子与珠粒之间的键裂解而释放或可释放的条形码,或者通过下面的珠粒本身的降解而释放的条形码,从而允许条形码被其它试剂接近或可被其它试剂接近,或两者。

如本文所述的可释放的条形码有时可被称为可活化的,因为一旦释放它们就可用于反应。因此,例如,可活化的条形码可通过从珠粒(或本文所述的其它合适类型的分区)释放条形码来活化。在所描述的方法和系统的上下文中还设想了其它可活化配置。

除了热裂解键、二硫键和UV敏感键外,可与前体或珠粒偶联的不稳定键的其它非限制性实例包括酯键(例如,可被酸、碱或羟胺裂解),邻位二醇键(例如,可经由高碘酸钠裂解),Diels-Alder键(例如,可经由热裂解),砜键(例如,可经由碱裂解),甲硅烷基醚键(例如,可经由酸裂解),糖苷键(例如,可经由淀粉酶裂解),肽键(例如,可经由蛋白酶裂解)或磷酸二酯键(例如,可经由核酸酶(例如DNA酶)裂解)。键可经由其它核酸分子靶向酶例如限制酶(例如限制核酸内切酶)裂解,如下文所进一步描述。

物质可在珠粒产生期间(例如,在前体聚合期间)包封在珠粒中。这样的物质可能参与或可能不参与聚合。可将这样的物质加入聚合反应混合物中,以使得生成的珠粒在珠粒形成时包含所述物质。在一些情况下,可在形成后将此类物质添加到凝胶珠粒中。这样的物质可包括例如核酸分子(例如寡核苷酸),用于核酸扩增反应的试剂(例如,引物、聚合酶、dNTP、辅因子(例如离子辅因子)、缓冲剂),包括本文所述的那些试剂,用于酶促反应的试剂(例如酶、辅因子、底物、缓冲剂),用于核酸修饰反应(例如聚合、连接或消化)的试剂,和/或用于一个或多个测序平台的模板制备(例如标签化)的试剂(例如,用于

可降解的珠粒可包含一种或多种具有不稳定键的物质,使得当将珠粒/物质暴露于适当的刺激下时,键断裂并且珠粒降解。不稳定键可以是化学键(例如,共价键、离子键)或可以是另一种类型的物理相互作用(例如,范德华相互作用、偶极-偶极相互作用等)。在一些情况下,用于产生珠粒的交联剂可包含不稳定键。当暴露于适当的条件下时,不稳定的键可能会断裂并且珠粒降解。例如,当将包含胱胺交联剂的聚丙烯酰胺凝胶珠粒暴露于还原剂时,胱胺的二硫键可被破坏并使珠粒降解。

当将适当的刺激施加到珠粒上时,与不降解的珠粒相比,可降解珠粒可用于更快地从珠粒上释放附接的物质(例如,核酸分子、条形码序列、引物等)。例如,对于结合到多孔珠粒的内表面上的物质,或在包封的物质的情况下,在珠粒降解时,所述物质在溶液中可具有更大的迁移率和与其它物质的可接近性。在一些情况下,物质也可经由可降解的接头(例如二硫键接头)附接至可降解的珠粒。可降解的接头可响应于与可降解珠粒相同的刺激,或者两种可降解物质可响应于不同的刺激。例如,条形码序列可经由二硫键附接至包含胱胺的聚丙烯酰胺珠粒。当条形码化的珠粒暴露于还原剂时,珠粒降解并且在条形码序列与珠粒之间的二硫键和珠粒中的胱胺的二硫键都断裂时释放出条形码序列。

根据上述公开内容应理解,虽然在许多情况下如上所述被称为珠粒的降解,但是降解可以指结合的或夹带的物质从珠粒上解离,其中存在和不存在物理珠粒本身的结构降解。例如,由于例如化学环境改变,夹带的物质可通过渗透压差从珠粒释放。举例来说,由于渗透压差而引起的珠粒孔径的改变通常会发生而珠粒本身不会结构降解。在一些情况下,由于珠粒的渗透性溶胀而导致的孔径增大可允许珠粒内夹带物质的释放。在其它情况下,由于孔径收缩,珠粒的渗透性收缩可能导致珠粒更好地保留夹带的物质。

在提供可降解珠粒的情况下,避免在给定时间之前将此类珠粒暴露于引起此类降解的一种或多种刺激中可能是有利的,例如,以避免珠粒过早降解以及由此类降解引起的问题,包括例如不良的流动特性和聚集。举例来说,在珠粒包含可还原的交联基团例如二硫化物基团的情况下,希望避免使这种珠粒与还原剂例如DTT或其它二硫键裂解试剂接触。在这样的情况下,在一些情况下将在不存在还原剂例如DTT的情况下提供对本文所述的珠粒的处理。因为在商业酶制剂中经常提供还原剂,所以可能期望在处理本文所述的珠粒时提供不含还原剂(或不含DTT)的酶制剂。这种酶的实例包括例如聚合酶制剂,逆转录酶制剂,连接酶制剂以及许多其它可用于处理本文所述的珠粒的酶制剂。术语“不含还原剂”或“不含DTT”的制剂可以指对于珠粒降解中使用的所述材料,具有小于约十分之一、小于约五十分之一或甚至小于约一百分之一的下限范围的制剂。例如,对于DTT,无还原剂的制剂可具有小于约0.01毫摩尔(mM)、0.005mM、0.001mM DTT、0.0005mM DTT或甚至小于约0.0001mMDTT。在许多情况下,DTT的量可能无法检测到。

可使用许多化学触发来触发珠粒的降解。这些化学变化的实例可包括但不限于pH介导的珠粒内组分完整性的变化,珠粒组分经由交联键的裂解而降解,以及珠粒组分的解聚。

在一些实施方案中,珠粒可由包含可降解的化学交联剂如BAC或胱胺的材料形成。此类可降解交联剂的降解可通过多种机制来完成。在一些实例中,珠粒可与化学降解剂接触,所述化学降解剂可引起氧化、还原或其它化学变化。例如,化学降解剂可以是还原剂,例如二硫苏糖醇(DTT)。还原剂的其它实例可包括β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫代丁基胺或DTBA)、三(2-羧乙基)膦(TCEP)或其组合。还原剂可降解形成珠粒的凝胶前体之间形成的二硫键,从而降解珠粒。在其它情况下,溶液的pH变化(例如pH增加)可能会触发珠粒的降解。在其它情况下,暴露于水溶液(例如水)可能会触发水解降解,从而导致珠粒降解。在一些情况下,刺激的任何组合都可能触发珠粒的降解。例如,pH变化可使化学剂(例如DTT)成为有效的还原剂。

在施加热刺激后,珠粒也可能被诱导以释放其内容物。温度变化可导致珠粒发生多种变化。例如,热量可导致固体珠粒液化。热量变化可导致珠粒熔化,使得一部分珠粒降解。在其它情况下,热量可能会增加珠粒组分的内部压力,从而使珠粒破裂或爆炸。热量还可能作用于用作构建珠粒的材料的热敏聚合物。

任何合适的试剂均可降解珠粒。在一些实施方案中,温度或pH的变化可用于降解珠粒内的热敏感键或pH敏感键。在一些实施方案中,化学降解剂可用于通过氧化、还原或其它化学变化来降解珠粒内的化学键。例如,化学降解剂可以是还原剂,例如DTT,其中DTT可使交联剂与凝胶前体之间形成的二硫键降解,从而使珠粒降解。在一些实施方案中,可添加还原剂以降解珠粒,这可能导致或可能不导致珠粒释放其内容物。还原剂的实例可包括二硫苏糖醇(DTT)、β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫代丁基胺或DTBA)、三(2-羧乙基)膦(TCEP)或其组合。还原剂可以约0.1mM、0.5mM、1mM、5mM、10mM的浓度存在。还原剂可以至少约0.1mM、0.5mM、1mM、5mM、10mM或大于10mM的浓度存在。还原剂可以至多约10mM、5mM、1mM、0.5mM、0.1mM或更小的浓度存在。

任何合适数量的分子标签分子(例如,引物、条形码化的寡核苷酸)都可与珠粒缔合,使得当从珠粒上释放后,分子标签分子(例如,引物,例如条形码化的寡核苷酸)以预定浓度存在于分区中。可选择这种预定浓度以促进某些反应以在分区内产生测序文库,例如扩增。在一些情况下,引物的预定浓度可通过产生带有寡核苷酸的珠粒的过程来限制。

尽管图1和图2已在上文在提供基本上单独占用的分区进行描述,但是在某些情况下,可能希望提供多重占用的分区,例如,在单个分区内包含两个、三个、四个或更多个包含条形码化的核酸分子(例如寡核苷酸)的细胞和/或微囊(例如珠粒)。因此,如上所述,可控制包含分析物载体和/或珠粒的流体和分区流体的流动特性,以提供这种多重占用的分区。特别地,可控制流动参数以提供分区的大于约50%,大于约75%并且在一些情况下大于约80%、90%、95%或更高的给定占用率。

在一些情况下,可使用另外的微囊将另外的试剂递送至分区。在这样的情况下,将不同的珠粒引入到共同的通道或液滴产生接合部可为有利的,从不同的珠粒源(例如,含有不同的缔合试剂)通过不同的通道入口进入这样的共同通道或液滴产生接合部(例如接合部210)中。在这种情况下,可控制不同珠粒进入通道或接合部的流量和频率,以提供来自每个来源的特定比率的微囊,同时确保这些珠粒在分区内与给定数量的分析物载体进行给定的配对或组合(例如,每个分区一个分析物载体和一个珠粒)。

本文所述的分区可包含小体积,例如小于约10微升(μL)、5μL、1μL、900皮升(pL)、800pL、700pL、600pL、500pL、400pL、300pL、200pL、100pL、50pL、20pL、10pL、1pL、500纳升(nL)、100nL、50nL或更小。

例如,在基于液滴的分区的情况下,液滴的总体积可小于约1000pL、900pL、800pL、700pL、600pL、500pL、400pL、300pL、200pL、100pL、50pL、20pL、10pL、1pL或更小。在与微囊共分区的情况下,应理解,在分区内的样品流体体积,例如,包括共分区的分析物载体和/或珠粒,可小于上述体积的约90%,小于约80%,小于约70%,小于约60%,小于约50%,小于约40%,小于约30%,小于约20%或小于约10%。

如本文其它地方所述,对物质进行分区可产生分区群体或多个分区。在这种情况下,可生成或以其它方式提供任何合适数量的分区。例如,可生成或以其它方式提供至少约1,000个分区、至少约5,000个分区、至少约10,000个分区、至少约50,000个分区、至少约100,000个分区、至少约500,000个分区、至少约1,000,000个分区、至少约5,000,000个分区、至少约10,000,000个分区、至少约50,000,000个分区、至少约100,000,000个分区、至少约500,000,000个分区、至少约1,000,000,000个分区或更多个分区。此外,多个分区可包括未占用的分区(例如空分区)和被占用的分区。

本文所述的组合物、方法和试剂盒可包括多个分区,其中多个分区中的一个或多个分区可包含一个或多个含条形码的珠粒、一个或多个合成细胞(或对照珠粒)或其任何组合。如本文所述,对照珠粒可在生物样品的处理(例如单细胞分析)中用作对照元件或内标。分区可包含一个或多个不同的珠粒。这样的珠粒可以是含条形码的珠粒或对照珠粒如合成细胞。这样的珠粒可以是对照珠粒(例如合成细胞)。

珠粒可包含各种分子。这样的分子可以是核酸分子或多肽。珠粒可以是对照珠粒。对照珠粒可使用缀合化学与分子偶联、附接至分子或以其它方式与分子缔合。如本文所述的缀合化学是指将第一分子与第二分子连接、偶联或附接的任何化学反应。缀合化学可包括生物缀合化学和点击化学。缀合化学可包括生物相互作用(例如生物素/链霉抗生物素蛋白相互作用)和/或生物正交反应。

除了使用点击化学之外,还可使用各种其它生物缀合或偶联方法将分子(例如核酸分子)附接至珠粒(例如凝胶珠粒)。这样的生物缀合方法可包括各种缀合策略和官能团修饰,例如甲磺酸酯形成、硫烷基化、NHS酯形成、氨基甲酸酯形成、碳酸酯形成、酰胺键形成或其任何组合。这样的策略和官能团修饰可用于各种反应类型,例如亲核和/或亲电取代反应、亲核和/或亲电加成反应以及其它合适的反应类型。在一些情况下,活化的羧酸可与亲核试剂如胺反应。在一些情况下,羧酸可附接至珠粒(例如,凝胶珠粒、对照珠粒等),并且亲核基团例如胺可附接至分子(例如核酸分子)以附接至所述珠粒。这样的酰胺键形成反应可包括EDC/NHS(例如,经由1-乙基-3-(3-二甲基-氨基丙基)碳二亚胺(EDC)和N-羟基琥珀酰亚胺(NHS)或4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉鎓氯化物(DMTMM))介导的偶联反应,其中活化的酯(例如,附接至珠粒表面的NHS酯)可与胺(例如,核酸分子的胺)反应形成酰胺键,从而将所述分子(例如核酸分子)附接至所述珠粒(例如凝胶珠粒)。可使用任何其它合适的生物缀合反应来将分子附接至珠粒。

核酸分子与条形码珠粒和/或对照珠粒(例如合成细胞)的偶联或附接可使用点击化学进行。点击化学可包括适合于合成细胞官能化的任何类型的点击反应。可与本文所述的方法和组合物结合使用的点击化学反应(或简称“点击反应”)的实例包括但不限于过渡金属催化的或应变促进的叠氮化物-炔烃环加成反应(例如,Huisgen叠氮化物-炔烃1,3-偶极环加成,铜催化的叠氮化物-炔烃环加成(CuAAC),应变促进的炔烃-叠氮化物环加成和/或钌催化的叠氮化物-炔烃环加成(RuAAC)),Diels-Alder反应如逆电子需求Diels-Alder反应(例如四嗪-反式环辛烯反应),或光点击反应(例如烯烃-四唑光反应)。

可使用这种点击化学将珠粒附接至一组或多组核酸分子。这样的珠粒可以是对照珠粒。对照珠粒可包含第一官能团(例如,可被其官能化)。第一官能团可以是用于点击反应的第一反应物。可附接至对照珠粒的一组或多组核酸分子可包含第二官能团。第一官能团可以是用于点击反应的第二反应物。点击反应是铜催化的叠氮化物-炔烃环加成反应、逆电子需求Diels-Alder反应或抗生物素蛋白-生物素相互作用。在一些情况下,点击反应是铜催化的叠氮化物-炔烃环加成反应,其包含叠氮化物官能化的核酸分子(例如,包含已知序列的核酸分子)和炔烃官能化的珠粒(例如,对照珠粒)。

第一官能团可在点击反应中与第二官能团反应。在一些情况下,可通过使所述第一官能团与所述第二官能团反应,将包含已知序列的核酸分子附接至对照珠粒。第一官能团是炔烃、反式环辛烯或抗生物素蛋白或其任何组合。在各种情况下,第一官能团是炔烃。第二官能团是叠氮化物、四嗪或生物素,或其组合。在多种情况下,第二官能团是叠氮化物。

核酸分子可以可释放地附接至珠粒(例如对照珠粒)。核酸分子可经由可释放的键可释放地附接至珠粒。核酸分子可经由可裂解的序列可释放地附接至珠粒。这样的可裂解序列可以是核苷酸序列和/或氨基酸序列。施加特定刺激后,可裂解序列可释放核酸分子。这种刺激可包括例如热刺激(例如,加热或冷却),光刺激(例如,通过光固化),化学刺激(例如,通过交联,前体的聚合引发(例如,通过添加的引发剂),pH介导等),机械刺激或其组合。

核酸分子(或任何其它分析物)可使用如本文所述的点击反应附接至珠粒。这样的点击反应可包括各种反应参数。这样的反应参数可包括反应温度、反应时间和反应溶液中存在的任何另外的试剂。反应参数可取决于要进行的点击反应的类型。例如,铜催化的叠氮化物-炔烃环加成反应可包括与抗生物素蛋白-生物素相互作用不同的一个或多个反应参数。

珠粒可被官能化以包含为某些反应(例如,与官能化的核酸分子的点击反应)提供反应性的第一官能团。可将要附接至珠粒上的核酸分子官能化以包含第二官能团,该第二官能团为某些反应(例如,与官能化的珠粒的点击反应)提供反应性。核酸分子可被官能化以包含叠氮化物部分。

在操作中,如图11的步骤1102中所示(也参见实施例1),用于修饰核酸分子以使其包含叠氮化物官能团的连接反应可包含合成核酸(例如RNA)的溶液(浓度为例如1-100μM、10-50μM或5-20μM),夹板或桥寡核苷酸(例如浓度为1-100μM、10-50μM或5-20μM),叠氮化物寡核苷酸(例如浓度为1-100μM、10-50μM或5-20μM)和连接酶,其中连接酶可以约10-100μg/μL、1-100μM、10-50μM或5-20μM的浓度存在。可通过添加连接缓冲液,将反应溶液进一步稀释和/或调节至特定体积。举例来说,用于修饰RNA分子以使其包含叠氮化物官能团的连接反应可包含10uM合成RNA、10uM夹板、40uM叠氮化物寡核苷酸和100U/uL或50ug/uL连接酶,可添加连接缓冲液直至特定体积(例如250uL)。可在特定温度(例如约16度(℃))下将反应温育特定时间段(例如1-3小时)。可添加EDTA(例如1-10μL或一定量以获得特定浓度)至反应溶液中以终止(或淬灭)反应。连接反应的定量可使用各种方法进行,所述方法包括使用荧光染料(例如AlexaFluor488、AlexaFluor647等)和/或例如Nanodrop等仪器,其可对各种反应条件进行高通量筛选。

包含第一官能团的珠粒可附接至包含第二官能团的核酸分子。珠粒可经由生物缀合化学附接至核酸分子。生物缀合方法可包括各种缀合策略和官能团修饰,例如甲磺酸酯形成、硫烷基化、NHS酯形成、氨基甲酸酯形成、碳酸酯形成、酰胺键形成或其任何组合。这样的策略和官能团修饰可用于各种反应类型,例如亲核和/或亲电取代反应、亲核和/或亲电加成反应以及其它合适的反应类型。在一些情况下,活化的羧酸可与亲核试剂例如胺反应。在一些情况下,羧酸可附接至珠粒(例如,凝胶珠粒、对照珠粒等),并且亲核基团例如胺可附接至分子(例如,核酸分子)以附接至所述珠粒。这样的酰胺键形成反应可包括EDC/NHS(例如,经由1-乙基-3-(3-二甲基-氨基丙基)碳二亚胺(EDC)和N-羟基琥珀酰亚胺(NHS)或4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉鎓氯化物(DMTMM))介导的偶联反应,其中活化的酯(例如,附接至珠粒表面的NHS酯)可与胺(例如,核酸分子的胺)反应形成酰胺键,从而将所述分子(例如核酸分子)附接至所述珠粒(例如凝胶珠粒)。可使用任何其它合适的生物缀合反应来将分子附接至珠粒。

可使用点击化学将核酸分子或其修饰衍生物附接至珠粒(例如凝胶珠粒)。在操作中,如图13的步骤1301所示(也参见实施例2),可将修饰为包含叠氮化物部分的核酸分子经由点击化学附接至对照珠粒。此类反应可能涉及一种或多种另外的试剂和/或缓冲溶液。这样的另外的试剂可包括催化剂。这样的催化剂可包含一种或多种过渡金属(例如铜)和一种或多种配体(例如THTPA)。叠氮化物官能化的核酸分子与炔烃官能化的对照珠粒之间的点击反应可在最终反应溶液中进行,其中执行的点击反应可具有反应的特定体积和特定最终浓度。例如,用于铜催化的叠氮化物-炔烃点击反应的最终反应混合物可包含约100-1000μL(例如300μL)的最终体积,约0.5-5mM(例如约1.25mM)的THPTA配体,约0.1-0.75(例如约0.25mM)CuAcO

可使用缀合化学(例如点击化学)将本文所述的任何珠粒附接至核酸分子。待功能化的珠粒可以是如本文所述的对照珠粒(例如合成细胞),因此,可在各种细胞分析过程(例如,生物样品的单细胞分析)中用作质量控制要素。对照珠粒可包含一个或多个分子(例如,用其官能化)。这样的分子可以是相同分子或可以是不同分子。对照珠粒可被官能化的分子可以是核酸分子(例如,RNA,例如mRNA)。这样的核酸分子可包含已知序列。对照珠粒可包含数百、数千或数百万个核酸分子。这样的核酸分子可具有相同的核酸序列或不同的核酸序列。对照珠粒可包含至少两个不同的核酸分子。对照珠粒可包含至少五个不同的核酸分子。对照珠粒可包含至少十个不同的核酸分子。对照珠粒可包含至少二十个不同的核酸分子。对照珠粒可用至少五十个不同的核酸分子官能化。对照珠粒可用至少一百个不同的核酸分子官能化。对照珠粒可用约1至约10个不同的核酸分子官能化。对照珠粒可用约10至约25个不同的核酸分子官能化。对照珠粒可用约20至约50个不同的核酸分子官能化。对照珠粒可用约25至约75个不同的核酸分子官能化。对照珠粒可用约50至约100个不同的核酸分子官能化。对照珠粒可用约75至约150个不同的核酸分子官能化。对照珠粒可用约100至约500个不同的核酸分子官能化。对照珠粒可用约250至约1000个不同的核酸分子官能化。对照珠粒可用约96个不同的核酸分子官能化。

对照珠粒可包含两个或更多个特定比率的两个或更多个不同核酸序列(例如,可被其官能化)(参见例如图10,其示出一个或多个合成细胞可各自被一个或多个不同的核酸分子官能化)。例如,对照珠粒可用两个不同的核酸分子(例如,包含不同核酸序列或以其它方式被不同修饰的核酸分子,例如在其3'和/或5'末端包含不同修饰的核酸分子)官能化,其中所述珠粒可用特定比率的两种不同的核酸分子官能化。取决于对照珠粒或合成细胞的应用,这种比率可在很大范围内变化。作为另一个实例,第一对照珠粒可用96个不同的核酸序列(例如基因)官能化,并且第二对照珠粒可用另外96个不同的核酸序列(例如基因)官能化,其中与第二对照珠粒的96个不同核酸序列(例如基因)相比,第一对照珠粒的96个不同核酸序列不同(例如,包含不同的核酸序列)。这样的第一对照珠粒和第二对照珠粒可用作细胞分析试剂盒中的质量控制要素。

对照珠粒可包含第一核酸分子和第二核酸分子。所述第一核酸分子和所述第二核酸分子可以特定比率附接至对照珠粒。第一核酸分子与第二核酸分子的比率可在约10

本公开的组合物、方法和试剂盒可包含第一对照珠粒和第二对照珠粒。所述第一对照珠粒和所述第二对照珠粒可以特定比率使用和/或存在。第一对照珠粒与第二对照珠粒的比率可在约10

本文所述的组合物、方法和试剂盒可包含一组或多组对照珠粒。一组对照珠粒可包括对照珠粒的一个或多个亚组,例如,对照珠粒的第一亚组和对照珠粒的第二亚组。对照珠粒的第一组(或亚组)和对照珠粒的第二组(或亚组)可以一种或多种比率存在于这样的组合物、方法和/或试剂盒中。这样的比率可为至少约1:0.001、1:0.01、1:0.1、1:0.2、1:0.3、1:0.4、1:0.5、1:0.6、1:0.7、1:0.8、1:0.9、1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90、1:100、1:1000或更大。这样的比率可为至多约1:1000、1:100、1:90、1:80、1:70、1:60、1:50、1:40、1:30、1:20、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1.9、1:1.8、1:1.7、1:1.6、1:1.5、1:1.4、1:1.3、1:1.2、1:1.1、1:1、1:0.9、1:0.8、1:0.7、1:0.6、1:0.5、1:0.4、1:0.3、1:0.2、1:0.1、1:0.01、1:0.001或更小。

本公开的组合物、方法和试剂盒可包含对照珠粒。如本文所述,这样的对照珠粒可包含两个或更多个不同的对照珠粒,其中两个或更多个不同的对照珠粒可以各种比率使用或存在,如本文进一步所述。两个或更多个不同的对照珠粒可各自包含两个或更多个不同的核酸分子(或被其官能化),其中合成细胞的这种两个或更多个不同的核酸分子可以不同比率使用或存在于合成细胞内或对照珠粒的表面上。因此,本公开的组合物、方法和试剂盒可以各种比率和量使用此类对照珠粒。例如,组合物、方法和/或试剂盒可包含两个对照珠粒(或两组或亚组的对照珠粒),其中两个对照珠粒中的每一者包含约96个不同的核酸分子(例如RNA分子)或被约96个不同的核酸分子(例如RNA分子)官能化。所述两个对照珠粒可以某些限定比率使用。在一些情况下,所述比率为约1:2。类似地,对照珠粒可被官能化的约96个不同核酸分子中的每一者可以某些限定比率存在于所述对照珠粒中(和/或其表面上)或所述对照珠粒的表面上。所述两个对照珠粒可用于如本文所述的方法或试剂盒中。

本文公开的对照珠粒可模拟单细胞处理实验中的单细胞行为。如本文所述,所述对照珠粒可以是包含一个或多个已知序列的珠粒。珠粒可以是凝胶珠粒。可将对照珠粒引入细胞样品中,并具有与细胞样品中其它细胞大致相同或基本相同的尺寸。对照珠粒可通过利用细胞样品在单个细胞处理实验的整个工作流中携带。测序后,可鉴定和分析对照珠粒中的一个或多个已知序列,以确定单细胞处理实验的各种特征,例如文库制备过程或测序过程的有效性或效率。因此,本文所述的对照珠粒(例如合成细胞)可用于文库制备过程和/或测序实验中,并且可用作对照标准物,与常规方法相比,所述标准物可以提高的准确性和效率来进行此类过程。例如,对照珠粒在分析和处理含有多于一个物种的细胞(例如人类和小鼠细胞(例如barnyard实验))的生物样品中特别有用。例如,本公开的对照珠粒可用于解释在这种barnyard实验期间可能产生的PCR嵌合体。

本公开的组合物、方法和试剂盒可在分区(例如液滴或孔)中包含含条形码的珠粒和/或对照珠粒或其任何组合(例如合成细胞),以用于分析生物样品(例如单细胞分析)。对照珠粒可充当质量控制要素和/或内标,以提高单细胞分析的准确性和效率,并解决本文中进一步描述的当前方法的缺点。例如,本公开的对照珠粒可用于确定双重峰率。

根据某些方面,可将分析物载体与裂解试剂一起分区,以释放分区内的分析物载体的内容物。在这种情况下,可在将分析物载体例如通过通道接合部上游的另外的一个或多个通道引入到分区接合部/液滴产生区(例如接合部210)的同时或之前不久,将溶解剂与分析物载体悬浮液接触。根据其它方面,另外地或可替代地,分析物载体可与其它试剂一起分区,如将在下面进一步描述的。

图3示出了用于将分析物载体和试剂共分区的微流体通道结构300的一个实例。通道结构300可包括通道区段301、302、304、306和308。通道区段301和302在第一通道接合部309处连通。通道区段302、304、306和308在第二通道接合部310处连通。

在一个示例性操作中,通道区段301可将包括多个分析物载体314的水性流体312沿着通道区段301输送到第二接合部310。作为替代或补充,通道区段301可输送珠粒(例如凝胶珠粒)。珠粒可包含条形码分子。

例如,通道区段301可连接至包含分析物载体314的水性悬浮液的贮器。在第二接合部310的上游以及即将到达第二接合部310之前,通道区段301可在第一接合部309处与通道区段302相遇。通道区段302可将悬浮在水性流体312中的多种试剂315(例如裂解剂)沿通道区段302输送到第一接合部309。例如,通道区段302可连接至包含试剂315的贮器。在第一接合部309之后,通道区段301中的水性流体312可将分析物载体314和试剂315两者朝向第二接合部310携带。在一些情况下,通道区段301中的水性流体312可包括一种或多种试剂,其可与试剂315相同或不同。可将与水性流体312不混溶的第二流体316(例如油)递送至通道区段304和306中的每一者的第二接合部310。在来自通道区段301的水性流体312和来自通道区段304和306中的每一者的第二流体316在第二通道接合部310处相遇时,水性流体312可在第二流体316中被分区为离散液滴318,并沿着通道区段308从第二接合部310流走。通道区段308可将离散液滴318递送至与通道区段308流体耦合的出口贮器,在所述出口贮器中可将它们收获。

第二流体316可包含油,例如氟化油,其包括用于稳定所得液滴的含氟表面活性剂,例如,抑制所得液滴318的后续聚结。

所产生的离散液滴可包括单独的分析物载体314和/或一种或多种试剂315。在一些情况下,所产生的离散液滴可包括携带条形码的珠粒(未示出),例如经由本文其它地方描述的其它微流体结构。在一些情况下,离散的液滴可能未被占用(例如,无试剂,无分析物载体)。

有利的是,当裂解试剂和分析物载体被共分区时,裂解试剂可促进分区内分析物载体的内容物的释放。分区中释放的内容物可能与其它分区的内容物保持离散。

应理解,本文所述的通道区段可耦合至各种不同的流体源或接收组件中的任何一者,包括贮器、管道、歧管或其它系统的流体组件。应理解,微流体通道结构300可具有其它几何形状。例如,微流体通道结构可具有两个以上的通道接合部。例如,微流体通道结构可具有2、3、4、5个或更多个通道区段,每个通道区段携带相同或不同类型的珠粒、试剂和/或分析物载体,其在通道接合部处相遇。可控制每个通道区段中的流体流动以控制将不同元件分区成液滴。流体可经由一个或多个流体流动单元被引导沿着一个或多个通道或贮器流动。流体流动单元可包括压缩机(例如,提供正压)、泵(例如,提供负压)、致动器等以控制流体的流动。也可或另外经由施加的压差、离心力、电动泵送、真空、毛细管或重力流等来控制流体。

裂解剂的实例包括生物活性试剂,例如用于裂解不同细胞类型(例如革兰氏阳性或阴性细菌,植物,酵母,哺乳动物等)的裂解酶,例如溶菌酶、无色肽酶、溶葡球菌酶、拉贝裂解酶(labiase)、肯塔裂解酶(kitalase)、酵母溶壁酶(lyticase)和可从例如Sigma-Aldrich,Inc.(St Louis,MO)获得的多种其它裂解酶,以及其它可商购的裂解酶。其它裂解剂可另外地或可替代地与分析物载体共分区,以引起分析物载体的内容物释放到分区中。例如,在一些情况下,可使用基于表面活性剂的裂解液来裂解细胞,尽管对于表面活性剂会干扰稳定乳液的基于乳液的系统而言,这些溶液可能不太理想。在一些情况下,裂解溶液可包括非离子表面活性剂,例如TritonX-100和Tween 20。在一些情况下,裂解溶液可包括离子表面活性剂,例如,十二烷基肌氨酸钠和十二烷基硫酸钠(SDS)。在某些情况下,也可使用电穿孔、热、声或机械细胞破坏,例如,基于非乳液的分区,例如分析物载体的包封,其可作为液滴分区的补充或替代,其中包封物的任何孔径在细胞破裂后足够小以保留给定大小的核酸片段。

作为与上述分析物载体共分区的裂解剂的替代或补充,还可将其它试剂与分析物载体共分区,包括例如DNA酶和RNA酶失活剂或抑制剂,例如蛋白酶K,螯合剂如EDTA,以及用于去除或以其它方式减少负活性或不同细胞裂解物组分对核酸后续处理的影响的其它试剂。另外,在包封的分析物载体的情况下,可将分析物载体暴露于适当的刺激下以从共分区的微囊中释放分析物载体或其内容物。例如,在一些情况下,化学刺激物可与包封的分析物载体一起共分区,以允许微囊的降解以及细胞或其内容物释放到更大的分区中。在一些情况下,该刺激可与本文其它地方描述的用于从其各自的微囊(例如珠粒)释放核酸分子(例如寡核苷酸)的刺激相同。在替代方面中,这可以是不同且不重叠的刺激,以便允许包封的分析物载体在与核酸分子释放到相同分区的不同时间释放到分区中。

其它试剂也可与分析物载体共分区,例如核酸内切酶以使分析物载体的DNA片段化,DNA聚合酶和dNTP用来扩增分析物载体的核酸片段并将条形码分子标签附接至扩增的片段上。其它酶可共分区,包括但不限于聚合酶、转座酶、连接酶、蛋白酶K、DNA酶等。另外的试剂还可包括逆转录酶,包括具有末端转移酶活性的酶、引物和寡核苷酸,以及转换寡核苷酸(在本文中也称为“转换寡核苷酸(switch oligos)”或“模板转换寡核苷酸”),其可用于模板转换。在一些情况下,模板转换可用于增加cDNA的长度。在一些情况下,模板转化可用于将预定核酸序列附加到cDNA。在模板转换的一个实例中,cDNA可从模板例如细胞mRNA的逆转录产生,其中具有末端转移酶活性的逆转录酶可以不依赖于模板的方式向cDNA添加另外的核苷酸,例如聚C。转换寡核苷酸可包括与另外的核苷酸互补的序列,例如聚G。cDNA上的其它核苷酸(例如聚C)可与转换寡核苷酸上的另外的核苷酸(例如聚G)杂交,由此逆转录酶可将转换寡核苷酸用作模板,以进一步扩展cDNA。模板转换寡核苷酸可包含杂交区域和模板区域。杂交区域可包含能够与靶标杂交的任何序列。在一些情况下,如前所述,杂交区域包含一系列G碱基,以与cDNA分子3'端的突出C碱基互补。该系列G碱基可包括1个G碱基、2个G碱基、3个G碱基、4个G碱基、5个G碱基或大于5个G碱基。模板序列可包含要并入cDNA中的任何序列。在一些情况下,模板区域包含至少1个(例如,至少2个、3个、4个、5个或更多个)标签序列和/或功能序列。转换寡核苷酸可包含脱氧核糖核酸;核糖核酸;修饰的核酸,包括2-氨基嘌呤、2,6-二氨基嘌呤(2-氨基-dA)、倒置dT、5-甲基dC、2'-脱氧肌苷、Super T(5-羟基丁炔基-2'-脱氧尿苷)、Super G(8-氮杂-7-脱氮鸟苷),锁核酸(LNA),解锁核酸(UNA,例如UNA-A、UNA-U、UNA-C、UNA-G)、Iso-dG、Iso-dC、2'氟代碱基(例如,氟代C、氟代U、氟代A和氟代G),或任何组合。

在一些情况下,转换寡核苷酸的长度可为至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249或250个核苷酸或更长。

在一些情况下,转换寡核苷酸的长度可为至多约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249或250个核苷酸。

一旦细胞的内容物释放到它们各自的分区中,包含在其中的大分子组分(例如,分析物载体的大分子成分,例如RNA、DNA或蛋白质)就可在分区内进一步处理。根据本文所述的方法和系统,可为各个分析物载体的大分子组分内容物提供唯一标识符,使得在表征那些大分子组分时,它们可被归属为源自相同的分析物载体或颗粒。通过将唯一标识符特定地分配给单个分析物载体或分析物载体组来提供将特征归属于单个分析物载体或分析物载体组的能力。可向单个分析物载体或分析物载体群体指定或关联例如呈核酸条形码形式的唯一标识符,以便以唯一标识符标识或标记分析物载体的大分子组分(以及因此其特征)。然后,这些唯一标识符可用于将分析物载体的组分和特征归属于单个分析物载体或分析物载体组。

在一些方面,这是通过将各个分析物载体或分析物载体组与唯一标识符共分区来执行的,例如上文所述(参考图2)。在一些方面,唯一标识符以核酸分子(例如寡核苷酸)的形式提供,所述核酸分子包含核酸条形码序列,所述核酸条形码序列可附接至或以其它方式缔合单个分析物载体的核酸内容物,或分析物载体的其它组分,并且特别是那些核酸的片段。核酸分子被分区,使得在给定分区中的核酸分子之间,其中包含的核酸条形码序列是相同的,但是在不同分区之间,核酸分子可以并且确实具有不同的条形码序列,或至少表示在给定分析中所有分区上的大量不同条形码序列。在一些方面,仅一个核酸条形码序列可与给定分区相关联,但是在一些情况下,可存在两个或更多个不同的条形码序列。

核酸条形码序列可在核酸分子(例如寡核苷酸)的序列内包含约6至约20个或更多个核苷酸。核酸条形码序列可包含约6至约20、30、40、50、60、70、80、90、100或更多个核苷酸。在一些情况下,条形码序列的长度可为约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,条形码序列的长度可为至少约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,条形码序列的长度可为至多约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更短。这些核苷酸可以是完全连续的,即在相邻核苷酸的单个节段中,或者它们可被分成两个或更多个被1个或更多个核苷酸隔开的独立子序列。在一些情况下,隔开的条形码子序列的长度可为约4至约16个核苷酸。在一些情况下,条形码子序列可为约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下,条形码子序列可为至少约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下,条形码子序列可为至多约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更短。

共分区的核酸分子还可包含其它功能序列,其可用于处理来自共分区的分析物载体的核酸。这些序列包括例如靶向或随机/通用扩增引物序列,以用于从分区内的各个分析物载体扩增基因组DNA,同时附接相缔合的条形码序列、测序引物或引物识别位点、杂交或探测序列,例如用于鉴定序列的存在或用于下拉条形码化的核酸,或许多其它潜在功能序列中的任一者。也可使用共分区寡核苷酸的其它机制,包括例如两个或更多个液滴的聚结,其中一个液滴含有寡核苷酸,或将寡核苷酸微分配到分区中,例如微流体系统内的液滴。

在一个实例中,提供了微囊,例如珠粒,其各自包括大量可释放地附接至珠粒的上述条形码化核酸分子(例如条形码化寡核苷酸),其中附接至特定珠粒的所有核酸分子将包括相同的核酸条形码序列,但是在所使用的珠粒群体中代表了大量不同的条形码序列。在一些实施方案中,例如包含聚丙烯酰胺聚合物基质的水凝胶珠粒被用作核酸分子进入分区的固体载体和递送媒介物,因为它们能够携带大量的核酸分子,并且可被配置为在暴露于特定刺激后释放那些核酸分子,如本文其它地方所述。在一些情况下,珠粒群体提供了多样化的条形码序列文库,其包括至少约1,000个不同的条形码序列、至少约5,000个不同的条形码序列、至少约10,000个不同的条形码序列、至少约50,000个不同的条形码序列、至少约100,000个不同的条形码序列、至少约1,000,000个不同的条形码序列、至少约5,000,000个不同的条形码序列或至少约10,000,000个不同的条形码序列或更多个。另外,每个珠粒可具有附接的大量核酸(例如寡核苷酸)分子。特别地,单个珠粒上包括条形码序列的核酸分子的分子数目可为至少约1,000个核酸分子、至少约5,000个核酸分子、至少约10,000个核酸分子、至少约50,000个核酸分子、至少约100,000个核酸分子、至少约500,000个核酸分子、至少约1,000,000个核酸分子、至少约5,000,000个核酸分子、至少约10,000,000个核酸分子、至少约50,000,000个核酸分子、至少约100,000,000个核酸分子、至少约250,000,000个核酸分子并且在一些情况下至少约10亿个核酸分子,或更多个。给定珠粒的核酸分子可包括相同(或共同)的条形码序列、不同的条形码序列或两者的组合。给定珠粒的核酸分子可包括多组核酸分子。给定组的核酸分子可包括相同的条形码序列。相同的条形码序列可不同于另一组核酸分子的条形码序列。

此外,当对珠粒群体进行分区时,所得的分区群体还可包括多样化的条形码文库,其包括至少约1,000个不同的条形码序列、至少约5,000个不同的条形码序列、至少约10,000个不同的条形码序列、至少至少约50,000个不同的条形码序列、至少约100,000个不同的条形码序列、至少约1,000,000个不同的条形码序列、至少约5,000,000个不同的条形码序列或至少约10,000,000个不同的条形码序列。另外,群体的每个分区可包括至少约1,000个核酸分子、至少约5,000个核酸分子、至少约10,000个核酸分子、至少约50,000个核酸分子、至少约100,000个核酸分子、至少约500,000个核酸、至少约1,000,000个核酸分子、至少约5,000,000个核酸分子、至少约10,000,000个核酸分子、至少约50,000,000个核酸分子、至少约100,000,000个核酸分子、至少约250,000,000个核酸分子并且在一些情况下至少约10亿个核酸分子。

在一些情况下,可能希望将多个不同的条形码并入给定的分区中,所述条形码附接至分区内的单个或多个珠粒。例如,在一些情况下,混合但已知的一组条形码序列可在后续处理中提供更大的标识保证,例如,通过提供条形码的更强地址或将条形码归属于给定分区,作为重复或独立确认给定分区的输出。

在对珠粒施加特定刺激后,核酸分子(例如寡核苷酸)可从珠粒上释放。在一些情况下,刺激可以是光刺激,例如通过光不稳定键的裂解,其释放核酸分子。在其它情况下,可使用热刺激,其中珠粒环境温度的升高将导致键断裂或核酸分子从珠粒的其它释放。在其它情况下,可使用化学刺激,其裂解核酸分子与珠粒连接的键,或以其它方式导致核酸分子从珠粒中释放。在一种情况下,此类组合物包括上述用于包封分析物载体的聚丙烯酰胺基质,并且可通过暴露于还原剂(例如DTT)而降解以释放所附接的核酸分子。

在一些方面,提供了用于受控分区的系统和方法。液滴尺寸可通过调节通道结构(例如,微流体通道结构)中的某些几何特征来控制。例如,可调节通道的扩大角、宽度和/或长度以控制液滴尺寸。

图4示出了用于将珠粒受控分区到离散液滴中的微流体通道结构的一个实例。通道结构400可包括通道区段402,该通道区段402在通道接合部406(或交点)处与贮器404连通。贮器404可以是腔室。如本文所用,对“贮器”的任何引用也可指“腔室”。在操作中,包括悬浮珠粒412的水性流体408可沿着通道区段402被输送到接合部406中,以与贮器404中的水性流体408不混溶的第二流体410相遇,从而产生流入贮器404中的水性流体408的液滴416、418。在水性流体408与第二流体410相遇的接合部406处,可基于例如以下因素形成液滴:在接合部406处的流体动力,两种流体408、410的流速,流体特性,和通道结构400的某些几何参数(例如,w、h

所产生的离散液滴可包括珠粒(例如,如在被占用的液滴416中)。可替代地,所产生的离散液滴可包括一个以上的珠粒。可替代地,所产生的离散液滴可能不包括任何珠粒(例如,如在未占用的液滴418中)。在一些情况下,如本文其它地方所述,所产生的离散液滴可包含一种或多种分析物载体。在一些情况下,所产生的离散液滴可包含一种或多种试剂,如本文其它地方所述。

在一些情况下,水性流体408可具有基本一致的珠粒412的浓度或频率。珠粒412可从单独的通道(图4中未示出)引入到通道区段402中。通道区段402中的珠粒412的频率可通过控制将珠粒412引入通道区段402的频率和/或通道区段402和单独通道中的流体的相对流速来控制。在一些情况下,珠粒可从多个不同的通道被引入通道区段402中,并相应地控制频率。

在一些情况下,通道区段402中的水性流体408可包含分析物载体(例如,参考图1和图2进行描述)。在一些情况下,水性流体408可具有基本一致的分析物载体的浓度或频率。与珠粒一样,可将分析物载体从单独的通道引入通道区段402。可通过控制将分析物载体引入通道区段402的频率和/或通道区段402和单独通道中流体的相对流速来控制通道区段402中的水性流体408中的分析物载体的频率或浓度。在一些情况下,可将分析物载体从多个不同的通道引入通道区段402中,并相应地控制频率。在一些情况下,第一单独通道可引入珠粒,并且第二单独通道可将分析物载体引入通道区段402中。引入珠粒的第一单独通道可在引入分析物载体的第二单独通道的上游或下游。

第二流体410可包含油,例如氟化油,其包括用于稳定所得液滴的含氟表面活性剂,例如,抑制所得液滴的后续聚结。

在一些情况下,第二流体410可能不经受和/或被引导任何流入或流出贮器404。例如,第二流体410可在贮器404中基本静止。在一些情况下,第二流体410可经受在贮器404内的流动,但是不流入或流出贮器404,例如经由向贮器404施加压力和/或如通过水性流体408在接合部406处的进入流所影响。可替代地,第二流体410可经受和/或被引导流入或流出贮器404。例如,贮器404可以是引导第二流体410从上游到下游,输送所产生的液滴的通道。

在接合部406处或附近的通道结构400可具有特定几何特征,所述几何特征至少部分地确定由通道结构400形成的液滴的尺寸。通道区段402可在接合部406处或附近具有高度h

举例来说,对于具有w=21μm、h=21μm和α=3°的通道结构,预测的液滴尺寸为121μm。在另一个实例中,对于具有w=25μm、h=25μm和α=5°的通道结构,预测的液滴尺寸为123μm。在另一个实例中,对于具有w=28μm、h=28μm和α=7°的通道结构,预测的液滴尺寸为124μm。

在一些情况下,扩大角α可在约0.5°至约4°、约0.1°至约10°、或约0°至约90°的范围之间。例如,扩大角可为至少约0.01°、0.1°、0.2°、0.3°、0.4°、0.5°、0.6°、0.7°、0.8°、0.9°、1°、2°、3°、4°、5°、6°、7°、8°、9°、10°、15°、20°、25°、30°、35°、40°、45°、50°、55°、60°、65°、70°、75°、80°、85°或更高。在一些情况下,扩大角可为至多约89°、88°、87°、86°、85°、84°、83°、82°、81°、80°、75°、70°、65°、60°、55°、50°、45°、40°、35°、30°、25°、20°、15°、10°、9°、8°、7°、6°、5°、4°、3°、2°、1°、0.1°、0.01°或更小。在一些情况下,宽度w可在约100微米(μm)至约500μm的范围内。在一些情况下,宽度w可在约10μm至约200μm的范围内。可替代地,宽度可小于约10μm。可替代地,宽度可大于约500μm。在一些情况下,进入接合部406的水性流体408的流速可在约0.04微升(μL)/分钟(min)和约40μL/min之间。在一些情况下,进入接合部406的水性流体408的流速可在约0.01微升(μL)/分钟(min)和约100μL/min之间。可替代地,进入接合部406的水性流体408的流速可小于约0.01μL/min。可替代地,进入接合部406的水性流体408的流速可大于约40μL/min,例如45μL/min、50μL/min、55μL/min、60μL/min、65μL/min、70μL/min、75μL/min、80μL/min、85μL/min、90μL/min、95μL/min、100μL/min、110μL/min、120μL/min、130μL/min、140μL/min、150μL/min或更大。在较低的流速下,例如约小于或等于10微升/分钟的流速,液滴半径可能不取决于进入接合部406的水性流体408的流速。

在一些情况下,所产生的液滴的至少约50%可具有一致的尺寸。在一些情况下,至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的所产生液滴可具有一致的尺寸。可替代地,少于约50%的所产生液滴可具有一致的尺寸。

液滴产生通量可通过增加产生点来增加,例如增加水性流体408的通道区段(例如通道区段402)与贮器404之间的接合部(例如接合部406)的数量。可替代地或另外地,可通过增加通道区段402中的水性流体408的流速来增加液滴产生通量。

图5示出了用于增加液滴产生通量的微流体通道结构的一个实例。微流体通道结构500可包括多个通道区段502和贮器504。多个通道区段502中的每一个可与贮器504流体连通。通道结构500可包括多个通道区段502与贮器504之间的多个通道接合部506。每个通道接合部可以是液滴产生点。来自图4中的通道结构400的通道区段402及其组件的任何描述可对应于通道结构500中的多个通道区段502的给定通道区段及其相应组件的任何描述。来自通道结构400的贮器404及其任何组件的描述可对应于来自通道结构500的贮器504及其相应组件的任何描述。

多个通道区段502中的每个通道区段可包含水性流体508,该水性流体508包括悬浮珠粒512。贮器504可包含与水性流体508不混溶的第二流体510。在一些情况下,第二流体510可能不经受和/或被引导任何流入或流出贮器504。例如,第二流体510在贮器504中可基本静止。在一些情况下,第二流体510可经受贮器504内的流动,而不是流入或流出贮器504,例如经由向贮器504施加压力和/或如通过水性流体508在接合部处的进入流所影响。可替代地,第二流体510可经受和/或被引导流入或流出贮器504。例如,贮器504可以是引导第二流体510从上游到下游,输送所产生的液滴的通道。

在操作中,包括悬浮珠粒512的水性流体508可沿着多个通道区段502被输送到多个接合部506中,以与贮器504中的第二流体510相遇以产生液滴516、518。从与贮器504的每个对应接合部处的每个通道区段可形成液滴。在水性流体508和第二流体510相遇的接合部处,可基于例如以下因素形成液滴:接合部处的流体动力,两种流体508、510的流速,流体特性,和通道结构500的某些几何参数(例如,w、h

对于多个通道区段502中的每个通道区段,几何参数w、h

在一些情况下,至少约50%的所产生液滴可具有一致的尺寸。在一些情况下,至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的所产生液滴可具有一致的尺寸。可替代地,少于约50%的所产生液滴可具有一致的尺寸。

图6示出了用于增加液滴产生通量的微流体通道结构的另一个实例。微流体通道结构600可包括围绕贮器604的周边大体上圆形布置的多个通道区段602。多个通道区段602中的每一者可与贮器604流体连通。通道结构600可包括在多个通道区段602与贮器604之间的多个通道接合部606。每个通道接合部可以是液滴产生点。来自图2中的通道结构400的通道区段402及其组件的任何描述可对应于通道结构600中的多个通道区段602的给定通道区段及其相应组件的任何描述。来自通道结构400的贮器404及其组件的任何描述可对应于来自通道结构600的贮器604及其相应组件的任何描述。

多个通道区段602中的每个通道区段可包含水性流体608,该水性流体608包括悬浮珠粒612。贮器604可包含与水性流体608不混溶的第二流体610。在一些情况下,第二流体610可能不经受和/或被引导任何流入或流出贮器604。例如,第二流体610可在贮器604中基本静止。在一些情况下,第二流体610可能经受贮器604内的流动,而不是流入或流出贮器604,例如经由向贮器604施加压力和/或如通过接合部处的水性流体608的进入流所影响。可替代地,第二流体610可能经受和/或被引导流入或流出贮器604。例如,贮器604可以是引导第二流体610从上游到下游,输送所产生液滴的通道。

在操作中,包括悬浮珠粒612的水性流体608可沿着多个通道区段602被输送到多个接合部606中,以与贮器604中的第二流体610相遇以产生多个液滴616。可从每个通道区段在与贮器604的每个相应接合部处形成液滴。在水性流体608与第二流体610相遇的接合部处,可基于例如以下因素形成液滴:接合部处的流体动力,两种流体608、610的流速,流体特性,以及通道结构600的某些几何参数(例如,通道区段602的宽度和高度、贮器604的扩大角等),如本文其它地方所述。通过从多个通道区段602连续注入水性流体608通过多个接合部606,可在贮器604中收集多个液滴。利用通道结构600的基本平行的通道配置,通量可显著增加。通道结构可具有尽可能多并由贮器尺寸所允许的基本平行的通道区段。例如,通道结构可具有至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、600、700、800、900、1000、1500、5000或更多个平行或基本平行的通道区段。多个通道区段可例如围绕贮器的边缘或周边基本均匀地间隔开。可替代地,多个通道区段的间隔可以是不均匀的。

贮器604可在每个通道接合部处或附近具有扩大角α(图6中未示出)。多个通道区段602中的每个通道区段可在通道接合部处或附近具有宽度w和高度h

在与多个通道区段602的不同通道接合部处,贮器604可具有相同或不同的扩大角。例如,圆形贮器(如图6所示)可具有圆锥形,圆顶状或半球形的顶板(例如顶壁)以在多个通道接合部606处或附近为每个通道区段602提供相同或基本相同的扩大角。当几何参数一致时,有利的是,即使通量增加,也可控制所得液滴尺寸为一致的。在一些情况下,当希望具有不同的液滴尺寸分布时,可相应地改变多个通道区段602的几何参数。

在一些情况下,至少约50%的所产生液滴可具有一致的尺寸。在一些情况下,至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的所产生液滴可具有一致的尺寸。可替代地,少于约50%的所产生液滴可具有一致的尺寸。注入液滴中的珠粒和/或分析物载体可能具有或可能不具有一致的尺寸。

图7A示出了具有用于受控分区的几何特征的微流体通道结构的另一实例的横截面图。通道结构700可包括通道区段702,所述通道区段702在与贮器704的通道接合部706(或交点)处连通。在一些情况下,通道结构700及其一个或多个组件可对应于通道结构100及其一个或多个组件。图7B示出了图7A的通道结构700的透视图。

可将包含多个颗粒716的水性流体712沿着通道区段702输送到接合部706中,以与贮器704中的水性流体712不混溶的第二流体714(例如油等)相遇,以产生流入贮器704中的水性流体712的液滴720。在水性流体712与第二流体714相遇的接合部706处,可基于例如以下因素形成液滴:接合部706处的流体动力,两个流体712、714的相对流速,流体性质,和通道结构700的某些几何参数(例如Δh等)。可通过从通道区段702在接合部706处连续注入水性流体712而在贮器704中收集多个液滴。

所产生的离散液滴可包含多个颗粒716中的一个或多个颗粒。如本文其它地方所述,颗粒可以是任何颗粒,例如珠粒、细胞珠粒、凝胶珠粒、分析物载体、分析物载体的大分子成分或其它颗粒。可替代地,所产生的离散液滴可能不包括任何颗粒。

在一些情况下,水性流体712可具有基本一致的颗粒716的浓度或频率。如本文其它地方所述(例如参考图4),可将颗粒716(例如珠粒)从单独的通道(图7中未示出)引入通道区段702中。可通过控制将颗粒716引入通道区段702中的频率和/或通道区段702和单独通道中的流体的相对流速来控制通道区段702中的颗粒716的频率。在一些情况下,可将颗粒716从多个不同的通道引入通道区段702中,并相应地控制频率。在一些情况下,可通过单独的通道引入不同的颗粒。例如,第一单独通道可引入珠粒并且第二单独通道可将分析物载体引入通道区段702中。引入珠粒的第一单独通道可在引入分析物载体的第二单独通道的上游或下游。

在一些情况下,第二流体714可能不经受和/或被引导任何流入或流出贮器704。例如,第二流体714可在贮器704中基本静止。在一些情况下,第二流体714可经受在贮器704内的流动,而不流入或流出贮器704,例如经由向贮器704施加压力和/或如通过接合部706处的水性流体712的进入流所影响。可替代地,第二流体714可能经受和/或被引导流入或流出贮器704。例如,贮器704可以是引导第二流体714从上游到下游,输送所产生的液滴的通道。

在接合部706处或附近的通道结构700可具有某些几何特征,其至少部分地确定由通道结构700形成的液滴的尺寸和/或形状。通道区段702可具有第一横截面高度h

高度差Δh可为至少约1μm。可替代地,高度差可为至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500μm或更大。可替代地,高度差可为至多约500、400、300、200、100、90、80、70、60、50、45、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1μm或更小。在一些情况下,扩大角β可在约0.5°至约4°、约0.1°至约10°、或约0°至约90°的范围之间。例如,扩大角可为至少约0.01°、0.1°、0.2°、0.3°、0.4°、0.5°、0.6°、0.7°、0.8°、0.9°、1°、2°、3°、4°、5°、6°、7°、8°、9°、10°、15°、20°、25°、30°、35°、40°、45°、50°、55°、60°、65°、70°、75°、80°、85°或更高。在一些情况下,扩大角可为至多约89°、88°、87°、86°、85°、84°、83°、82°、81°、80°、75°、70°、65°、60°、55°、50°、45°、40°、35°、30°、25°、20°、15°、10°、9°、8°、7°、6°、5°、4°、3°、2°、1°、0.1°、0.01°或更小。

在一些情况下,进入接合部706的水性流体712的流速可在约0.04微升(μL)/分钟(min)和约40μL/min之间。在一些情况下,进入接合部706的水性流体712的流速可在约0.01微升(μL)/分钟(min)和约100μL/min之间。可替代地,进入接合部706的水性流体712的流速可小于约0.01μL/min。可替代地,进入接合部706的水性流体712的流速可大于约40μL/min,例如45μL/min、50μL/min、55μL/min、60μL/min、65μL/min、70μL/min、75μL/min、80μL/min、85μL/min、90μL/min、95μL/min、100μL/min、110μL/min、120μL/min、130μL/min、140μL/min、150μL/min或更大。在较低的流速下,例如在约小于或等于10微升/分钟的流速下,液滴半径可能不取决于进入接合部706的水性流体712的流速。第二流体714在贮器704中可能静止或基本静止。可替代地,第二流体714可例如以上文针对水性流体712所述的流速流动。

在一些情况下,至少约50%的所产生液滴可具有一致的尺寸。在一些情况下,至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的所产生液滴可具有一致的尺寸。可替代地,少于约50%的所产生液滴可具有一致的尺寸。

虽然图7A和图7B示出了高度差Δh在接合部706处突然变化(例如,逐步增加),高度差可逐渐增加(例如,从约0μm至最大高度差)。可替代地,高度差可从最大高度差逐渐减小(例如,逐渐变小)。如本文所用,高度差的逐渐增加或减小可以指高度差的连续递增或递减,其中高度轮廓的任何一个微分区段与高度轮廓的紧邻的微分区段之间的角度大于90°。例如,在接合部706处,通道的底壁和贮器的底壁可以大于90°的角度相遇。可替代地或另外地,通道的顶壁(例如顶板)和贮器的顶壁(例如顶板)可以大于90°的角度相遇。逐渐增加或减少可以是线性的或非线性的(例如,指数的、正弦的等)。可替代地或另外地,高度差可线性地或非线性地可变地增加和/或减小。虽然图7A和图7B示出了膨胀的贮器横截面高度为线性的(例如,恒定的扩大角β),横截面高度可非线性地扩大。例如,贮器可至少部分地由具有可变扩大角的圆顶状(例如半球形)形状限定。横截面高度可以任何形状扩大。

例如如上文或本文其它地方所述的通道网络可与适当的流体组件流体耦合。例如,入口通道区段被流体耦合至它们将要递送至通道接合部的材料的适当来源。这些来源可包括多种不同的流体组件中的任何一者,从限定在微流体装置的主体结构中或连接至微流体装置的主体结构的简单贮器,到从设备外源、歧管、流体流动单元(例如,致动器、泵、压缩机)等递送流体的流体导管。同样,出口通道区段(例如,通道区段208、贮器604等)可流体耦合至用于分区细胞的接收容器或导管,以用于后续处理。此外,这可以是限定在微流体装置的主体中的贮器,或者它可以是用于将分区细胞递送至后续处理操作、仪器或组件的流体导管。

本文描述的方法和系统可用于极大地提高单细胞应用和/或接收基于液滴的输入的其它应用的效率。例如,在对被占用的细胞和/或适当大小的细胞进行分选之后,可执行的后续操作可包括扩增产物的产生,纯化(例如,经由固相可逆固定化(SPRI)),进一步处理(例如,剪切、功能序列的连接以及后续扩增(例如,经由PCR))。这些操作可能会大量发生(例如,在分区外部)。在分区是乳液中的液滴的情况下,乳液可被破坏并且液滴的内容物被汇集以用于另外的操作。可与带有条形码的珠粒一起共分区的另外的试剂可包括用于封闭核糖体RNA(rRNA)的寡核苷酸和用于从细胞中消化基因组DNA的核酸酶。可替代地,可在另外的加工操作期间应用rRNA去除剂。通过这种方法产生的构建体的构型可帮助在测序期间最小化(或避免)对聚-T序列的测序和/或对多核苷酸序列的5'端进行测序。扩增产物,例如第一扩增产物和/或第二扩增产物,可经受测序以进行序列分析。在一些情况下,可使用部分发夹测序扩增(PHASE)方法进行扩增。

多种应用需要评估分析物载体群体中不同分析物载体或生物类型的存在和定量,包括例如微生物组分析和表征、环境测试、食品安全性测试、流行病学分析(例如在追踪污染时)等。

本公开提供了被编程为实现本公开的方法的计算机系统。图17示出了计算机系统1701,该计算机系统1701被编程或以其它方式配置为(i)控制微流体系统(例如流体流),(ii)从未占用的液滴中分选被占用的液滴,(iii)使液滴聚合,(iv)执行测序应用,(v)生成和维持条形码化分析物文库,以及(vi)分析结果,例如确定双重峰率或UMI纯度。计算机系统1701可以是用户的电子设备或相对于所述电子设备远程定位的计算机系统。所述电子设备可以是移动电子设备。

计算机系统1701包括中央处理单元(CPU,在本文中也称为“处理器”和“计算机处理器”)1705,其可以是单核或多核处理器,或用于并行处理的多个处理器。计算机系统1701还包括存储器或存储器位置1710(例如,随机存取存储器、只读存储器、闪存),电子存储单元1715(例如硬盘),用于与一个或多个其它系统进行通信的通信接口1720(例如网络适配器),以及外围设备1725(例如,高速缓存、其它存储器、数据存储和/或电子显示适配器)。存储器1710、存储单元1715、接口1720和外围设备1725通过例如主板的通信总线(实线)与CPU1705通信。存储单元1715可以是用于存储数据的数据存储单元(或数据存储库)。计算机系统1701可借助于通信接口1720可操作地耦合到计算机网络(“网络”)1730。网络1730可以是因特网,因特网和/或外部网,或与因特网通信的内部网和/或外部网。在一些情况下,网络1730是电信和/或数据网络。网络1730可包括一个或多个计算机服务器,其可实现分布式计算,例如云计算。在一些情况下,网络1730可借助于计算机系统1701实现对等网络,该对等网络可使耦合至计算机系统1701的设备起到客户端或服务器的作用。

CPU 1705可执行一系列机器可读指令,所述机器可读指令可体现在程序或软件中。指令可存储在例如存储器1710的存储器位置中。指令可被定向到CPU 1705,其可随后进行编程或以其它方式配置CPU 1705以实现本公开的方法。CPU 1705执行的操作的实例可包括获取、解码、执行和写回。

CPU 1705可以是电路例如集成电路的一部分。系统1701的一个或多个其它组件可包括在电路中。在一些情况下,电路是应用程序专用集成电路(ASIC)。

存储单元1715可存储文件,例如驱动器、文库和保存的程序。存储单元1715可存储用户数据,例如用户偏好和用户程序。在一些情况下,计算机系统1701可包括位于计算机系统1701外部的一个或多个另外的数据存储单元,例如位于通过内部网或因特网与计算机系统1701通信的远程服务器上。

计算机系统1701可通过网络1730与一个或多个远程计算机系统通信。例如,计算机系统1701可与用户(例如操作者)的远程计算机系统通信。远程计算机系统的实例包括个人计算机(例如,便携式PC),板型或平板电脑(例如,

可通过存储在计算机系统1701的电子存储位置上,例如存储在存储器1710或电子存储单元1715上的机器(例如计算机处理器)可执行代码的方式来实现本文所述的方法。机器可执行或机器可读代码可以软件形式提供。在使用期间,代码可由处理器1705执行。在一些情况下,可从存储单元1715中检索代码并将其存储在存储器1710中以供处理器1705随时存取。在一些情况下,可排除电子存储单元1715,并且将机器可执行指令存储在存储器1710中。

可对代码进行预编译并配置为供具有适于执行代码的处理器的机器使用,或者可在运行期间被编译。代码可以编程语言提供,所述编程语言可经选择以使代码能够以预编译或实时编译的方式执行。

本文提供的系统和方法(例如计算机系统1701)的各个方面可体现在编程中。可将技术的各个方面视为通常以机器可读介质的类型承载或体现的机器(或处理器)可执行代码和/或关联数据的形式的“产品”或“制品”。机器可执行代码可存储在电子存储单元如存储器(例如,只读存储器、随机存取存储器、闪存)或硬盘上。“存储”类型介质可包括计算机、处理器等的任何或所有有形存储器,或其相关模块,例如可在软件编程的任何时间提供非暂态存储的各种半导体存储器、磁带驱动器、磁盘驱动器等。软件的全部或部分有时可通过因特网或各种其它电信网络进行通信。这样的通信例如可使得能够将软件从一个计算机或处理器加载到另一计算机或处理器,例如从管理服务器或主机加载到应用服务器的计算机平台。因此,可承载软件元件的另一种类型的介质包括光波、电波和电磁波,例如通过本地装置之间的物理接口、有线和光学陆线网络以及通过各种空中链路使用的光波、电波和电磁波。承载这种波的物理元件(例如有线或无线链路、光链路等)也可以被认为是承载软件的介质。如本文所用,除非限于非暂态的有形“存储”介质,否则例如计算机或机器“可读介质”的术语是指参与向处理器提供指令以供执行的任何介质。

因此,例如计算机可执行代码的机器可读介质可采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,例如任何计算机中的任何存储设备等,例如可用于实现附图中所示的数据库等。易失性存储介质包括动态存储器,例如这种计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光纤,包括构成计算机系统内总线的电线。载波传输介质可采用电信号或电磁信号或声波或光波的形式,例如在射频(RF)和红外(IR)数据通信期间生成的那些。因此,计算机可读介质的常见形式包括例如:软磁盘,软盘,硬盘,磁带,任何其它磁性介质,CD-ROM,DVD或DVD-ROM,任何其它光学介质,打孔卡纸磁带,任何其它具有孔图案的物理存储介质,RAM,ROM,PROM和EPROM,FLASH-EPROM,任何其它存储芯片或盒,传输数据或指令的载波,传输此类载体的电缆或链路,或计算机可从中读取编程代码和/或数据的任何其它介质。这些形式的计算机可读介质中的许多可能涉及将一个或多个指令的一个或多个序列传送到处理器以供执行。

计算机系统1701可包括电子显示器1735或与其通信,所述电子显示器1735包括用户界面(UI)1740,用于提供例如测序分析的结果,例如双重峰率或UMI纯度率,或者用于一个或多个单细胞应用单元或微流体单元的控制面板。UI的实例包括但不限于图形用户界面(GUI)和基于web的用户界面。

可通过一种或多种算法来实现本公开的方法和系统。可在通过中央处理单元1705执行时利用软件来实现算法。所述算法可例如生成测序结果并处理测序结果以确定例如双重峰率或UMi纯度率,或单细胞应用的其它参数。

本公开的装置、系统、组合物和方法可用于各种应用,例如,处理单个分析物(例如,RNA、DNA或蛋白质)或多种分析物(例如,DNA和RNA,DNA和蛋白质,RNA和蛋白质,或RNA、DNA和蛋白质)形成单细胞。例如,将分析物载体(例如细胞或细胞珠粒)分配在分区(例如液滴)中,并且对来自分析物载体的多种分析物进行处理以用于后续处理。多种分析物可来自单细胞。例如,这可使细胞同时进行蛋白质组学、转录组学和基因组分析。

实施例

以下实施例仅说明本公开,而无意以任何方式限制本公开。

实施例1

连接RNA构建体的产生

该实施例证实了可用于官能化珠粒(例如,可用作对照珠粒的凝胶珠粒)的连接RNA构建体的产生和分析。

RNA转录物首先是由Integrated DNA Technologies(IDT)合成的gblock产生的,所述序列在5'端用T7引物(例如TAATACGACTCACTATAGGG)设计,以随后用于经由体外转录进行RNA合成。该实验中使用的gblock的序列如下所示,但可使用任何序列。使用了以下两种示例性RNA转录物:

TAATACGACTCACTATAGGGAGCGTCTGTTATGATTCGGTTGTACCCGGAACAACTCCGTGCTCAGCTCAATGAAGGGCTGCGTGCAGCATATCTTTTACTTGGTAACGATCCTCTGTTATTGCAGGAAAGCCAGGACGCTGTTCGTCAGGTAGCTGCGGCACAAGGATTCGAAGAACACCACACTTTTTCCATTGATCCCAACACTGACTGGAATGCGATCTTTTCGTTATGCCAGGCTATGAGTCTGTTTGCCAGTCGACAAACGCTATTGCTGTTGTTACCAGAAAACGGACCGAATGCGGCGATCAATGAGCAACTTCTCACACTCACCGGACTTCTGCATGACGACCTGCTGTTGATCGTCCGCGGTAATAAATTAAGCAAAGCGCAAGAAAATGCCGCCTGGTTTACTGCGCTTGCGAATCGCAGCGTGCAGGTGACCTGTCAGACACCGGAGCAGGCTCAGCTTCCCCGCTGGGTTGCTGCGTAG(SEQ ID NO:1,合成细胞#1),和

TAATACGACTCACTATAGGGAGCGTCTCTTATCATTCGGTTGTACCCGGAACAACTCCGATCGCAGCTCAATGAAGGGCTGCGCGATGCGTATCTTTTACTTGGTAACGATCCTCTGTTATTGCAG(SEQ ID NO:2,合成细胞#2)。

图11示出了随后如何使用带有拖尾的New England Biolabs HiScribe T7 ARCAmRNA试剂盒在步骤1101中从这些转录物中产生RNA,但是,可使用任何类似的一个或多个试剂盒来完成体外转录、加帽和A拖尾。该过程产生了RNA序列,该序列从T7引物的最后一个鸟嘌呤开始并且在RNA的3'端以100-150个腺嘌呤结束。使用Zymo Clean和Concentrator试剂盒清洁并浓缩了RNA,但任何试剂盒均可用于清洁RNA。然后使用Nanodrop分析仪对合成RNA的浓度进行定量。

使用T4 DNA连接酶、包含10个胸腺嘧啶和10bp识别序列的单链夹板序列以及在5'端含有10bp互补识别序列和在3'端含有叠氮基团的寡核苷酸完成RNA分子与叠氮基团的连接,如图11的步骤1102所示。DNA连接酶可来自任何制造商,但实验中使用的一种来自Enzymatics并且储备液为500mg/mL。另外,寡核苷酸可由任何制造商合成,但这些寡核苷酸是由IDT制造的。

连接反应包含10uM合成RNA、10uM夹板、40uM叠氮化物寡核苷酸和100U/uL或50ug/uL连接酶,然后添加连接缓冲液至250uL。将反应物在16度下温育1小时,然后加入3uL EDTA以终止反应。然后使用Zymo Clean and Concentrator试剂盒清洁反应物,以除去小的未连接的寡核苷酸。然后使用Nanodrop分析仪定量连接的RNA的浓度。

通过数字液滴PCR(ddPCR)验证该连接。设计引物和探针以扩增全长连接产物并引起荧光。图12A(源自使用的第一RNA转录物)和图12B(源自使用的第一RNA转录物)显示了ddPCR测试连接反应中不同比率组分的结果,其中第一个数字代表合成的RNA,第二个数字代表夹板寡核苷酸,并且第三个数字代表叠氮化物寡核苷酸。粉色线上方的点数表示样品中全长连接的RNA的数量。在所测试的反应比率中,1:1:4的比率似乎具有最高数量的阳性事件。连接的RNA产物在-80下储存,直至用于点击到凝胶珠粒(例如对照珠粒)上。

该实施例证实核酸分子(例如RNA分子)可被各种部分(例如那些使珠粒例如对照珠粒官能化的部分)有效地官能化。

实施例2

RNA官能化凝胶珠粒的产生

该实施例证实了使用叠氮化物修饰的RNA样品(例如,如以上实施例1中所述产生的那些)的RNA官能化的凝胶珠粒(例如,可用作对照珠粒的那些)的产生和分析。

首先,使用本领域已知的方法产生30μm RNA官能化的凝胶珠粒(参见例如美国专利第9,695,468号、第9,951,386号和第9,689,024号以及美国专利申请公开第2015/0376609号、第2017/0321252号、第2018/0016634号、第2018/0216162号和第2018/0371540号,所述文献通过引用整体并入本文中),不同之处在于,将凝胶珠粒上的引物替换为含有炔烃基团的引物,所述引物可稍后用于点击化学反应中。另外,使用双丙烯酰胺代替Bis-Cys,以防止珠粒溶解在DTT中。配制水溶液使得最终凝胶珠粒的炔烃浓度为20uM。

还使官能化的凝胶珠粒通过流动凸轮以验证尺寸,这些官能化的凝胶珠粒不像未经修饰的基因组凝胶珠粒一样溶胀,三次操作的平均大小(每次操作测量25,000-30,000个凝胶珠粒)为28.24um。较小的尺寸可能是由于用bis-cys取代了双丙烯酰胺。

使用点击化学将叠氮化物官能化的RNA构建体附接至珠粒上,并使用50mM配体THPTA、10mM乙酸铜、100mM抗坏血酸钠、0.16mM连接的RNA和20uM凝胶珠粒的储备溶液完成(参见例如图13中所示的步骤1301)。最终反应是300uL 1.25mM THPTA、0.25mM CuAcO

通过使用聚-T寡核苷酸与由IDT合成的Alexa647探针对聚-A尾进行探针杂交,完成了点击化学反应的验证,并从而验证了RNA分子附接至珠粒。将50uL洗涤和包装的凝胶珠粒与50uL的12uM聚T探针混合。将反应物置于95℃的热混合器上,并盖上盖子以保护探针免受光的影响。然后将热混合器设定为25℃和1000rpm,并在摇动的同时将反应物缓慢冷却。冷却后,再次用缓冲液清洁混合物以除去未点击的RNA和探针。将5uL的混合物加入到Guava分析管中的1495uL缓冲液,将其通过涡旋混合,然后置于Guava机器中。测试了三个技术重复实验。如果连接和点击化学成功,则应存在附接至凝胶珠粒的聚A序列,然后将其与聚T探针杂交,从而在Guava上产生可见的荧光增加。

图14A-D示出了在Guava上的该测试的结果,峰在X轴上的位置表示红色荧光的水平。阴性对照(图14A)经过了连接和点击过程,但不包含叠氮化物,因此无法进行点击,但混合物中存在聚A序列。观察到的荧光信号右移(图14A-C)表明荧光增加,这证实了凝胶珠粒确实含有合成的RNA,并因此表明核酸分子附接至珠粒上。

本实施例证实了实施例1中产生的叠氮化物官能化的RNA分子可有效地附接(例如,经由点击化学和/或共价或非共价键形成而化学连接)至凝胶珠粒。这种官能化的凝胶珠粒可用作对照珠粒,例如,用作单细胞分析过程中的对照要素。

实施例3

RNA官能化的凝胶珠粒在单细胞测序中的使用

本实施例证实在单细胞测序实验中使用如以上实施例2中产生的包含RNA分子(例如,附接至其表面)的合成细胞以确定在测序后是否可检测到转录物。

实验中使用的合成细胞是使用实施例1中所述的转录物序列产生的。珠粒上具有SEQ ID NO:1和SEQ ID NO:2的转录物的比率为约1:2。

对于这项研究,使用了约1000个合成细胞。产生了cDNA并且峰的大小与预期的转录物大小匹配,在75bp处有一个另外的峰,其可能是引物二聚体。生物分析仪迹线如图15所示。

然后从cDNA制备文库并且图16中相应的生物分析仪迹线显示了结果。cDNA序列随机片段化,这可能解释了本研究中观察到的峰宽。测试样品中的前两个峰和第一个阴性对照可能来自cDNA中可见的引物二聚体,而后两个峰分别对应于311bp和674bp,仅在测试样品中可见,并因此与预期转录物对应的可能性很高。

随后,两个测试样品的文库均提交给MiSeq分析仪进行测序。两种样品均产生大量R2序列,但3%的读段映射到一个或两个转录物的一部分。转录物序列(参见实施例1)的序列可能太相似以至于无法确定两个序列之间的比率,但是,在测序分析中清楚地观察到了预期的转录物。

因此,本文提供的数据证实本文描述的合成细胞可用作单细胞分析生物样品中的文库制备工具和/或测序标准。数据进一步表明,在测序期间可回收经由点击化学方法附接至凝胶珠粒或对照珠粒的核酸序列,就如同所述核酸序列属于细胞(例如,有待在单细胞分析中分析的生物样品的细胞)一样。

尽管已经在本文中示出和描述了本发明的优选实施方案,但是对于本领域技术人员而言显而易见的是,仅通过示例的方式提供了这样的实施方案。并非意图通过本说明书中提供的特定实施例来限制本发明。尽管已经参考前述说明书描述了本发明,但是本文中的实施方案的描述和图示并不意味着以限制性的意义来解释。在不脱离本发明的情况下,本领域技术人员现在将想到许多变化、改变和替换。此外,应理解,本发明的所有方面不限于本文所阐述的具体描述、构造或相对比例,其取决于各种条件和变量。应理解,本文描述的本发明的实施方案的各种替代方案可用于实施本发明。因此,可预期的是,本发明还将涵盖任何这样的替代、修改、变化或等同形式。意图是所附权利要求限定本发明的范围,并且由此涵盖这些权利要求范围内的方法和结构及其等同物。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号