首页> 中国专利> 分析来自单个细胞或细胞群体的核酸的方法

分析来自单个细胞或细胞群体的核酸的方法

摘要

用于通过对单个细胞或细胞群体的内容物的分配分析来分析单个细胞或细胞群体的方法、组合物以及系统。将单个细胞或细胞群体与处理试剂共分配以获取细胞内容物以及独特地识别给定细胞或细胞群体的所述内容物,并且随后分析所述细胞的内容物,并且将其表征为源于单个细胞或细胞群体,包括通过测序分析和表征所述细胞的核酸。

著录项

说明书

本申请是申请日为2015年06月26日、申请号为201580034263.7、发明名称为“分析来自单个细胞或细胞群体的核酸的方法”的中国专利申请(其对应PCT申请的申请日为2015年06月26日、申请号为PCT/US2015/038178)的分案申请。

相关申请的交叉引用

本申请要求2014年6月26日提交的美国临时专利申请号62/017,558和2014年10月8日提交的美国临时专利申请号62/061,567的优先权,这些申请中的每一者出于所有目的以全文引用的方式并入本文中。

背景

分析和表征生物和生化材料和系统的显著进步引起在了解生命、健康、疾病以及治疗机制方面的前所未有的进步。在这些进步中,靶向和表征生物系统的基因组构成的技术已经产生了一些最突破性的结果,包括在使用和开发基因扩增技术和核酸测序技术方面的进步。

核酸测序可被用于获得多种生物医学背景中的信息,所述生物医学背景包括诊断、预后、生物技术以及法医生物学。测序可能涉及:基本方法,包括马克萨姆-吉尔伯特测序(Maxam-Gilbert sequencing)和链终止法;或从头测序法,包括鸟枪测序和桥式PCR;或下一代法,包括聚合酶克隆测序、454焦磷酸测序、Illumina测序、SOLiD测序、Ion Torrent半导体测序、HeliScope单分子测序、

尽管在生物表征方面取得了这些进步,但许多挑战仍未得到解决,或通过现今所提供的解决方案得到相对较差地解决。本公开提供用于解决许多现有技术的不足之处的新型解决方案和办法。

简述

本文提供用于分析单个细胞或小细胞群体的方法、组合物以及系统,包括分析来自这些单个细胞或细胞群体的核酸以及将核酸归属至这些单个细胞或细胞群体。

本公开的一个方面提供一种分析来自细胞的核酸的方法,其包括将源于单个细胞的核酸提供至离散分区中;产生源于所述离散分区内的所述核酸的一个或多个第一核酸序列,所述一个或多个第一核酸序列已连接于包含共同核酸条形码序列的寡核苷酸;产生对所述一个或多个第一核酸序列或源于所述一个或多个第一核酸序列的一个或多个第二核酸序列的表征,所述一个或多个第二核酸序列包含所述共同条形码序列;并且至少部分基于在所产生的表征中存在所述共同核酸条形码序列将所述一个或多个第一核酸序列或一个或多个第二核酸序列识别为源于所述单个细胞。

在一些实施方案中,离散分区为离散微滴。在一些实施方案中,将寡核苷酸与源于单个细胞的核酸共分配至离散分区中。在一些实施方案中,将所述寡核苷酸中的至少10,000个、至少100,000个或至少500,000个与源于单个细胞的核酸共分配至离散分区中。

在一些实施方案中,提供连接至珠粒的寡核苷酸,其中珠粒上的各寡核苷酸包含相同的条形码序列,并且将珠粒与单个细胞共分配至离散分区中。在一些实施方案中,寡核苷酸可释放地连接至珠粒。在一些实施方案中,珠粒包括可降解珠粒。在一些实施方案中,在产生一个或多个第一核酸序列之前或期间,所述方法包括经由降解珠粒使寡核苷酸从珠粒释放。在一些实施方案中,在产生表征之前,所述方法包括使一个或多个第一核酸序列从离散分区释放。

在一些实施方案中,产生表征包括对一个或多个第一核酸序列或一个或多个第二核酸序列进行测序。所述方法还可包括由一个或多个第一核酸序列或一个或多个第二核酸序列的序列组装单个细胞的基因组的至少一部分的连续核酸序列。此外,所述方法还可包括基于单个细胞的基因组的至少一部分的核酸序列来表征单个细胞。

在一些实施方案中,核酸从离散分区中的单个细胞释放。在一些实施方案中,核酸包括核糖核酸(RNA),诸如信使RNA(mRNA)。在一些实施方案中,产生一个或多个第一核酸序列包括在产生一个或多个第一核酸序列的条件下使核酸进行反转录。在一些实施方案中,反转录在离散分区中进行。在一些实施方案中,寡核苷酸被提供于离散分区中并且包含多聚胸苷酸(poly-T)序列。在一些实施方案中,反转录包括使多聚胸苷酸序列与核酸中的每一者的至少一部分杂交并且以模板定向的方式延伸多聚胸苷酸序列。在一些实施方案中,寡核苷酸包含促进多聚胸苷酸序列的杂交的锚定序列。在一些实施方案中,寡核苷酸包含随机引导序列,所述随机引导序列可为例如随机六聚体。在一些实施方案中,反转录包括使随机引导序列与核酸中的每一者的至少一部分杂交并且以模板定向的方式延伸随机引导序列。

在一些实施方案中,一个或多个第一核酸序列中的给定者与核酸中的给定者的至少一部分具有序列互补性。在一些实施方案中,离散分区至多包括多个细胞之中的单个细胞。在一些实施方案中,寡核苷酸包含独特的分子序列区段。在一些实施方案中,所述方法可包括至少部分基于独特的分子序列区段的存在将一个或多个第一核酸序列或一个或多个第二核酸序列的单个核酸序列识别为源于核酸中的给定核酸。在一些实施方案中,所述方法包括基于独特的分子序列区段的存在测定给定核酸的量。

在一些实施方案中,所述方法包括在产生表征之前,将一个或多个额外序列添加至一个或多个第一核酸序列以产生一个或多个第二核酸序列。在一些实施方案中,所述方法包括在转换寡核苷酸的辅助下将第一额外核酸序列添加至一个或多个第一核酸序列。在一些实施方案中,转换寡核苷酸与一个或多个第一核酸序列的至少一部分杂交,并且以模板定向的方式延伸以使第一额外核酸序列与一个或多个第一核酸序列偶接。在一些实施方案中,所述方法包括扩增与第一额外核酸序列偶接的一个或多个第一核酸序列。在一些实施方案中,扩增在离散分区中进行。在一些实施方案中,扩增在使与第一额外核酸序列偶接的一个或多个第一核酸序列从离散分区释放之后进行。

在一些实施方案中,在扩增之后,所述方法包括将一个或多个第二额外核酸序列添加至与第一额外序列偶接的一个或多个第一核酸序列以产生一个或多个第二核酸序列。在一些实施方案中,添加一个或多个第二额外序列包括去除与第一额外核酸序列偶接的一个或多个第一核酸序列中的每一者的一部分以及使其与一个或多个第二额外核酸序列偶接。在一些实施方案中,所述去除经由对与第一额外核酸序列偶接(例如连接)的一个或多个第一核酸序列进行剪切来完成。

在一些实施方案中,在产生表征之前,所述方法包括使一个或多个第一核酸序列进行转录以产生一个或多个RNA片段。在一些实施方案中,转录在使一个或多个第一核酸序列从离散分区释放之后进行。在一些实施方案中,寡核苷酸包含T7启动子序列。在一些实施方案中,在产生表征之前,所述方法包括去除一个或多个RNA序列中的每一者的一部分以及使额外序列与一个或多个RNA序列偶接。在一些实施方案中,在产生表征之前,所述方法包括使与额外序列偶接的一个或多个RNA序列进行反转录以产生一个或多个第二核酸序列。在一些实施方案中,在产生表征之前,所述方法包括扩增一个或多个第二核酸序列。在一些实施方案中,在产生表征之前,所述方法包括使一个或多个RNA序列进行反转录以产生一个或多个DNA序列。在一些实施方案中,在产生表征之前,所述方法包括去除一个或多个DNA序列中的每一者的一部分以及使一个或多个额外序列与一个或多个DNA序列偶接以产生一个或多个第二核酸序列。在一些实施方案中,在产生表征之前,所述方法包括扩增一个或多个第二核酸序列。

在一些实施方案中,核酸包括由单个细胞的RNA的反转录产生的互补(cDNA)。在一些实施方案中,寡核苷酸包含引导序列并且被提供于离散分区中。在一些实施方案中,所述引导序列包括随机N-mer。在一些实施方案中,产生一个或多个第一核酸序列包括使引导序列与cDNA杂交以及以模板定向的方式延伸引导序列。

在一些实施方案中,离散分区包含含有寡核苷酸的互补序列的转换寡核苷酸。在一些实施方案中,产生一个或多个第一核酸序列包括使转换寡核苷酸与源于核酸的核酸片段的至少一部分杂交以及以模板定向的方式延伸转换寡核苷酸。在一些实施方案中,产生一个或多个第一核酸序列包括将寡核苷酸连接至一个或多个第一核酸序列。在一些实施方案中,一个或多个第一核酸序列为源于核酸的核酸片段。在一些实施方案中,产生一个或多个第一核酸序列包括使寡核苷酸与核酸偶接(例如连接)。

在一些实施方案中,多个分区包括离散分区。在一些实施方案中,多个分区平均包含每个分区少于一个细胞。在一些实施方案中,多个分区中少于25%的分区不包含细胞。在一些实施方案中,多个分区包含包括具有至少一个分配的细胞的离散分区。在一些实施方案中,少于25%、少于20%、少于15%、少于10%、少于5%或少于1%的离散分区包含超过一个细胞。在一些实施方案中,至少离散分区的子集包含珠粒。在一些实施方案中,至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的离散分区包含至少一个细胞和至少一个珠粒。在一些实施方案中,离散分区包含分配的核酸条形码序列。在一些实施方案中,离散分区包含至少1,000个、至少10,000个或至少100,000个不同的分配的核酸条形码序列。在一些实施方案中,多个分区包括至少1,000个、至少10,000个或至少100,000个分区。

在另一方面,本公开提供一种表征多种不同细胞类型的群体中的细胞的方法,其包括将来自群体中的单个细胞的核酸提供至离散分区中;将包含共同核酸条形码序列的寡核苷酸连接至来自离散分区内的单个细胞的核酸的一个或多个片段,其中多个不同分区包含不同的共同核酸条形码序列;以及表征来自多个离散分区的核酸的一个或多个片段,并且至少部分基于共同条形码序列的存在将一个或多个片段归属于单个细胞;以及基于对多个离散分区中的一个或多个片段的表征来表征群体中的多个单个细胞。

在一些实施方案中,所述方法包括将核酸片段化。在一些实施方案中,离散分区为微滴。在一些实施方案中,表征核酸的一个或多个片段包括对单个细胞的核糖体脱氧核糖核酸进行测序,并且表征细胞包括识别细胞属、种、株或变体。在一些实施方案中,单个细胞源于微生物组样品。在一些实施方案中,单个细胞源于人组织样品。在一些实施方案中,单个细胞源于哺乳动物中的循环细胞。在一些实施方案中,单个细胞源于法医样品。在一些实施方案中,核酸从离散分区中的单个细胞释放。

本公开的额外方面提供表征单个细胞或细胞群体的方法,其包括在允许一个或多个细胞表面特征物结合基与其各自的细胞表面特征物(若存在)之间结合的条件下,将细胞与多种不同的细胞表面特征物结合基类型一起孵育,其中各种不同的细胞表面结合基类型能够结合于不同的细胞表面特征物,并且其中各种不同的细胞表面结合基类型包含与其缔合的报告寡核苷酸;将细胞分配至包含含有条形码序列的多个寡核苷酸的分区中;将条形码序列连接至存在于分区中的寡核苷酸报告基;对寡核苷酸报告基和连接的条形码进行测序;以及基于测序的报告寡核苷酸来表征存在于细胞上的细胞表面特征物。

本公开的额外方面提供一种包含多个分区的组合物,多个分区中的每一者包含单个细胞和包含共同核酸条形码序列的寡核苷酸群体。在一些实施方案中,多个分区包括乳液中的微滴。在一些实施方案中,多个分区中的每一者内的寡核苷酸群体与设置于多个分区中的每一者内的珠粒偶接。在一些实施方案中,单个细胞已与同各自的细胞表面特征物缔合的多个不同的细胞表面特征物结合基缔合,并且各种不同类型的细胞表面特征物结合基包含含有不同核苷酸序列的寡核苷酸报告基。在一些实施方案中,多个不同的细胞表面特征物结合基包括对多个不同的细胞表面特征物具有结合亲和力的多个不同的抗体或抗体片段。

由以下详细描述,本公开的额外方面和优点对本领域技术人员来说将变得轻易地显而易见,在以下详细描述中仅示出和描述了本公开的说明性实施方案。如将认识到的,本公开能够实现其他和不同实施方案,并且在各种明显的方面其若干细节能够进行修改,所有这些都不脱离本公开。因此,图式和描述将被视为在本质上是说明性的,而不是限制性的。

以引用的方式并入

本说明书中提到的所有出版物、专利以及专利申请以引用的方式并入本文中,其程度如同每个单个出版物、专利或专利申请被具体地和单独地指示以引用的方式并入一般。以引用的方式并入的出版物和专利或专利申请与本说明书中所含的公开内容矛盾的情况下,说明书旨在取代和/或优先于任何此类矛盾材料。

附图简述

本发明的新颖特征在所附权利要求书中被特别阐述。通过参考以下使用本发明原理阐述说明性实施方案的详细描述以及附图(在本文中也称为“图”和“FIG.”)将获得对本发明的特征和优点的更好的理解,在附图中:

图1示意性说明用于分配单个细胞或小细胞群组的微流体通道结构。

图2示意性说明用于对细胞和珠粒或包含额外试剂的微胶囊进行共分配的微流体通道结构。

图3示意性说明用于扩增和条形码化细胞的核酸的示例性方法。

图4提供对在将序列数据归属于单个细胞或细胞群组时使用细胞的核酸的条形码化来用于其表征的示意性说明。

图5提供说明细胞与经标记的细胞结合配体缔合的示意图。

图6提供对使用本文所描述的方法进行RNA分析的示例性工作流程的示意性说明。

图7提供对用于使用本文所描述的方法对核糖核酸(RNA)的分析的示例性条形码化寡核苷酸结构的示意性说明。

图8提供与单个带条形码的珠粒一起共分配的单个细胞的图像。

图9A-E提供对用于RNA的分析的示例性条形码化寡核苷酸结构和用于进行RNA分析的示例性操作的示意性说明。

图10提供对用于RNA的示例性分析的示例性条形码化寡核苷酸结构和使用序列来进行体外转录示意性说明。

图11提供对用于RNA的分析的示例性条形码化寡核苷酸结构和用于进行RNA分析的示例性操作的示意性说明。

图12A-B提供对用于RNA的分析的示例性条形码化寡核苷酸结构的示意性说明。

图13A-C提供对分区中的模板转换反转录和PCR的示例性产量的说明。

图14A-B提供对具有不同细胞数目的分区中的反转录和cDNA扩增的示例性产量的说明。

图15提供对在不同输入细胞浓度下cDNA合成和实时定量PCR的示例性产量以及不同引物浓度对在固定细胞输入浓度下的产量的影响的说明。

图16提供对体外转录的示例性产量的说明。

图17示出了经编程或以其他方式被配置成实现本文所提供的方法的示例性计算机控制系统。

详细描述

虽然本文中已示出和描述了本发明的各个实施方案,但对本领域技术人员来说将显而易见的是此类实施方案仅仅是通过举例而提供。本领域技术人员会想到许多变化、改变以及替换,而不会脱离本发明的范围。应了解,可采用对本文中所描述的本发明实施方案的各种替代方案。

在将值描述为范围的情况下,应了解,此类公开包括公开此类范围内的所有可能的子范围,以及在此类范围内的特定数值,不管特定数值或特定子范围是否被明确陈述。

I.单一细胞分析

先进的核酸测序技术已在对生物材料进行测序方面产生重要结果,包括提供大量关于单个生物体的序列信息以及相对纯的生物样品。然而,这些系统尚未被证明在能够识别和表征生物样品中的可代表样品的总构成的较小少数的细胞子群体方面有效,但单个化的序列信息可被证明对此甚至更有价值。

大多数核酸测序技术得出其所测序的核酸来自从组织或其他样品获得的细胞集合。可对细胞进行全体处理以提取代表细胞群体的一般情况的基因材料,然后可将所述基因材料处理成准备测序的DNA文库,所述DNA文库是针对给定测序技术进行配置。如将了解,虽然经常就DNA或核酸进行讨论,但源于细胞的核酸可包括DNA或RNA,包括例如mRNA、总RNA等,可对其进行处理以产生cDNA,以便例如使用多种RNA-seq方法中的任一种来进行测序。在此处理之后,在此类整体方法中,在不存在细胞特异性标记的情况下,事实上不可能将基因材料归因于是由样品中的细胞子集或所有细胞贡献。

除了不能将特征归属于细胞群体的特定子集,此类整体样品制备方法还从一开始就倾向于主要识别和表征细胞样品中的多数组分,并且未被设计成能够挑出少数组分,例如由样品中的一个细胞、数个细胞或全部细胞中的较小百分比所贡献的基因材料。同样地,在分析例如mRNA的表达水平的情况下,整体方法将倾向于潜在地由就表达水平来说非同质的细胞群体呈现非常不准确的数据。在一些情况下,在所分析的群体中的较小少数的细胞中表达高并且在群体中的多数细胞中的表达不存在的情况下,整体方法将指示整个群体的低水平表达。

通过在由这些样品建立测序文库时所用的处理操作,此原始多数偏向被进一步放大,并且甚至具压倒性。特定而言,大多数下一代测序技术依赖于核酸片段的几何扩增,诸如聚合酶链式反应,以产生足够用于测序文库的DNA。然而,此类几何扩增偏向于扩增样品中的多数组分,并且可能不保留此类少数和多数组分的起始比率。举例来说,由于比较指数扩增(较高浓度的重复倍增快速超过较小组分的重复倍增)并且由于扩增试剂和资源的隔离(因为较大组分被扩增,其优先利用引物和其他扩增试剂),如果样品包括95%的来自样品中的特定细胞类型(例如宿主组织细胞)的DNA以及5%的来自另一细胞类型(例如癌细胞)的DNA,那么基于PCR的扩增可优先扩增多数DNA而不是少数DNA。

虽然这些困难中的一些可通过利用不同测序系统(诸如不需要扩增的单分子系统)来解决,但单分子系统以及其他下一代测序系统的整体测序方法还可具有对足够大的输入DNA的要求的要求。特定而言,如Pacific Biosciences SMRT测序系统的单分子测序系统可具有500纳克(ng)高至10微克(μg)的样品输入DNA要求,此远大于由单个细胞或甚至小细胞子群体可得到的。同样地,可针对样品中约50ng至约1μg的样品DNA起始量对其他NGS系统进行优化。

II.细胞的区室化和表征

然而,本文公开尤其在较大的细胞群体的背景下用于表征来自小细胞群体的核酸以及在一些情况下用于表征来自单个细胞的核酸的方法和系统。所述方法和系统提供以下优点:能够提供具有其他下一代系统的高通量的非扩增单分子方法的归属优点,以及能够对可源自单个细胞或小细胞集合的极低量的输入核酸进行处理和测序的额外优点。

特定而言,本文所描述的方法将包括例如来自单个细胞或小细胞群组的核酸的单个细胞或小细胞群体的分析区室化,并且然后允许将所述分析归属回到核酸所源于的单个细胞或小细胞群组。不管细胞群体是代表细胞类型的50/50混合物、细胞类型的90/10混合物抑或实际上细胞类型的任何比率以及不同细胞类型的完全异质混合物或这些之间的任何混合物,此均可实现。不同细胞类型可包括来自个体的不同组织类型、来自不同个体、来自不同的属、种、株、变体或任何或所有上述各项的任何组合的细胞或生物体。举例来说,不同细胞类型可包括来自个体的正常组织和肿瘤组织;来自环境、法医、微生物组或其他样品的多种不同细菌种、株以及/或者变体;或细胞类型的多种其他混合物中的任一种。

在一个方面,本文所描述的方法和系统提供来自含有细胞的样品材料的单个细胞的核酸内容物区室化、沉淀或分配至离散区室或分区(本文中可互换地称为分区)中,其中各分区保持其自己的内容物与其他分区的内容物隔开。可先前、随后或同时将独特的标识(例如条形码)递送至容纳被区室化或分配的细胞的分区,以允许随后将单个细胞的特征归属于特定区室。

如本文中所用,在一些方面,分区是指器皿或容器(诸如纳米阵列衬底(例如BioTrove纳米阵列)中的孔、微孔、管、通孔或其他器皿)。然而,在许多一些方面,区室或分区包括可在流体流内流动的分区。这些分区可包含例如具有包围内部流体中心或核心的外部屏障的微胶囊或微囊泡,或其可为能够夹带和/或保留基质内的材料的多孔基质。然而,在一些方面,这些分区包括非水连续相(例如油相)内的水性流体的微滴。多种不同的容器描述于例如2013年8月13日提交的美国专利申请号13/966,150中,该专利申请的全部公开内容出于所有目的以全文引用的方式并入本文中。同样地,用于形成非水性或油性连续相中的稳定微滴的乳液系统详细描述于例如美国专利公布号2010/0105112中,该专利公布的全部公开内容出于所有目的以全文引用的方式并入本文中。

在乳液中的微滴的情况下,将单个细胞分派至离散分区通常可通过以下方式来实现:将细胞于水性流体中的流动流引入非水性流体的流动流中,使得在两种流的接头处产生微滴。通过以某一细胞浓度水平提供水性含细胞流,可控制所得分区就细胞数目来说的占用水平。在一些情况下,在需要单一细胞分区的情况下,可能需要控制流体的相对流速,使得分区平均每个分区含有少于一个细胞,以确保那些被占用的分区主要是单一占用的。同样地,可能希望控制流速以使得更高百分比的分区被占用,从而例如仅允许较小百分比的未占用分区。在一些方面,控制流量和通道结构以确保所需数目的单一占用分区、低于某一水平的未占用分区以及低于某一水平的多重占用分区。

在许多情况下,使用所述系统和方法来确保绝大多数的被占用的分区(含有一个或多个微胶囊的分区)每个被占用的分区包括不超过1个细胞。在一些情况下,控制分配过程,使得少于25%的被占用的分区含有超过一个细胞,并且在许多情况下,少于20%的被占用的分区具有超过一个细胞,而在一些情况下,少于10%或甚至少于5%的被占用的分区每个分区包括超过一个细胞。

另外或或者,在许多情况下,需要避免形成数目过多的空分区。虽然这可通过将足够数目的细胞提供至分配区中来实现,但泊松分布(poissonian distribution)预期会增加将包括多个细胞的分区的数目。因此,根据本文所描述的方面,控制被定向至分配区中的一个或多个细胞或其他流体的流量,使得在许多情况下,不超过50%的所产生的分区未被占用,即包括少于1个细胞,不超过25%的所产生的分区、不超过10%的所产生的分区可未被占用。此外,在一些方面,控制这些流量以呈现单一占用分区的非泊松分布,同时提供较低水平的未占用分区。再次陈述,在一些方面,可实现上文所提到的范围的未占用分区,同时仍提供上文所描述的单一占用率中的任一种。举例来说,在许多情况下,使用本文所描述的系统和方法形成具有低于25%、低于20%、低于15%、低于10%并且在许多情况下低于5%的多重占用率的所得分区,同时具有低于50%、低于40%、低于30%、低于20%、低于10%并且在一些情况下低于5%的未占用分区。

如应了解,上文所描述的占用率还可适用于包括细胞与承载条形码寡核苷酸的珠粒两者的分区。特定而言,在一些方面,全部被占用的分区中相当大比例将包括珠粒与细胞两者。特定而言,可能需要使得至少50%的分区被至少一个细胞和至少一个珠粒占用,或至少75%的分区可被如此占用,或甚至至少80%或至少90%的分区可被如此占用。此外,在需要在分区内提供单一细胞和单一珠粒的那些情况下,至少50%的分区可被如此占用,至少60%、至少70%、至少80%或甚至至少90%的分区可被如此占用。

虽然上文就提供大体上单一占用的分区进行了描述,但在某些情况下,可能需要提供例如在单一分区内含有两个、三个、四个或更多个细胞和/或珠粒的多重占用分区。因此,如上文所提到,可控制含有细胞和/或珠粒的流体和分配流体的流动特征以提供此类多重占用分区。特定而言,可控制流动参数以提供占分区的大于50%、大于75%并且在一些情况下大于80%、90%、95%或更高的占用率。

另外,在许多情况下,单一分区内的多个珠粒可包含与其缔合的不同试剂。在此类情况下,可能有利的是从不同珠粒来源(即含有不同的所缔合的试剂)通过进入共同的通道或微滴产生接头的不同通道入口将不同珠粒引入此类共同的通道或微滴产生接头中。在此类情况下,可控制不同珠粒进入通道或接头的流量和频率以从各来源提供所需比率的微胶囊,同时确保所需配对或组合的此类珠粒进入具有所需数目的细胞的分区。

本文所描述的分区的特征经常为具有极小的体积,例如小于10μL、小于5μL、小于1μL、小于900皮升(pL)、小于800pL、小于700pL、小于600pL、小于500pL、小于400pL、小于300pL、小于200pL、小于100pL、小于50pL、小于20pL、小于10pL、小于1pL、小于500纳升(nL)或甚至小于100nL、50nL或甚至更小。

举例来说,在基于微滴的分区的情况下,微滴可具有小于1000pL、小于900pL、小于800pL、小于700pL、小于600pL、小于500pL、小于400pL、小于300pL、小于200pL、小于100pL、小于50pL、小于20pL、小于10pL或甚至小于1pL的总体积。在与珠粒共分配的情况下,应了解,分区内例如包括共分配的细胞的样品流体体积可为上文所描述的体积的少于90%、少于80%、少于70%、少于60%、少于50%、少于40%、少于30%、少于20%或甚至为上文所描述的体积的少于10%。

如本文中别处所描述,分配物质可产生分区群体。在此类情况下,可产生任何适当数目的分区以产生分区群体。举例来说,在本文所描述的方法中,可产生包含至少约1,000个分区、至少约5,000个分区、至少约10,000个分区、至少约50,000个分区、至少约100,000个分区、至少约500,000个分区、至少约1,000,000个分区、至少约5,000,000个分区、至少约10,000,000个分区、至少约50,000,000个分区、至少约100,000,000个分区、至少约500,000,000个分区或至少约1,000,000,000个分区的分区群体。此外,分区群体可包含未占用的分区(例如空分区)与被占用的分区两者。

在某些情况下,微流体通道网络特别适合用于产生如本文所描述的分区。此类微流体装置的实例包括详细描述于2014年4月4日提交的临时美国专利申请号61/977,804中的那些,该专利申请的全部公开内容出于所有目的以全文引用的方式并入本文中。在分配单个细胞时还可采用替代机制,包括多孔膜,细胞的水性混合物穿过所述多孔膜被挤压至非水性流体中。此类系统通常可自例如Nanomi,Inc.获得。

图1中说明了用于分配单个细胞的简化的微流体通道结构的实例。如本文中别处所描述,在一些情况下,多数被占用的分区每个被占用的分区包括不超过一个细胞,并且在一些情况下,一些所产生的分区未被占用。不过,在一些情况下,一些被占用的分区可包括超过一个细胞。在一些情况下,可控制分配过程,使得少于25%的被占用的分区含有超过一个细胞,并且在许多情况下,少于20%的被占用的分区具有超过一个细胞,而在一些情况下,少于10%或甚至少于5%的被占用的分区每个分区包括超过一个细胞。如图所示,通道结构可包括在通道接头110处连通的通道区段102、104、106以及108。在操作中,可沿着通道区段102将包括悬浮的细胞114的第一水性流体112传送至接头110中,同时将不与水性流体112混溶的第二流体116从通道区段104和106递送至接头110,以形成包括单个细胞114的水性流体的离散微滴118,从而流至通道区段108中。

在一些方面,此第二流体116包含油,诸如氟化油,其包括用于稳定所得微滴(例如,抑制所得微滴的后续聚结)的含氟表面活性剂。特别适用的分配流体和含氟表面活性剂的实例描述于例如美国专利公布号2010/0105112中,该专利公布的全部公开内容出于所有目的以全文引用的方式并入本文中。

在其他方面,除了基于微滴的分配或作为基于微滴的分配的替代方案,可将细胞封装于包含其中夹带一个或多个单个细胞或小细胞群组的外壳或层或多孔基质的微胶囊内,并且可包括其他试剂。可通过多种方法来进行细胞的封装。一般来说,此类方法将含有待分析的细胞的水性流体与对聚合物前体施加特定刺激之后能够形成为凝胶或其他固体或半固体基质的聚合前体材料组合在一起。此类刺激包括例如热刺激(加热或冷却)、光刺激(例如,通过光固化)、化学刺激(例如,通过使前体交联、引发前体的聚合(例如,通过添加的引发剂)等。

可通过多种方法来进行包含细胞的微胶囊的制备。举例来说,可使用气刀微滴或气溶胶产生器来将前体流体的微滴分配至胶凝化溶液中以形成包括单个细胞或小细胞群组的微胶囊。同样地,可使用基于膜的封装系统(诸如可自例如Nanomi,Inc.获得的那些)来产生本文所描述的微胶囊。在一些方面,如图1中所示的微流体系统可容易地用于封装本文所描述的细胞。特定而言,并且参考图1,使包含细胞和聚合物前体材料的水性流体流入通道接头110中,在所述通道接头中通过非水性流体116的流动将其分配至包含单个细胞114的微滴118中。在封装方法的情况下,非水性流体116还可包括引发剂以引起聚合物前体的聚合和/或交联从而形成包括夹带细胞的微胶囊。特别适用的聚合物前体/引发剂对的实例包括描述于例如2014年2月7日提交的美国专利申请号61/940,318、2014年5月9日提交的美国专利申请号61/991,018以及2014年6月26日提交的美国专利申请号14/316,383中的那些,所述专利申请的全部公开内容出于所有目的以全文引用的方式并入本文中。

举例来说,在聚合物前体材料包含线性聚合物材料(例如,线性聚丙烯酰胺、PEG或其他线性聚合材料)的情况下,活化剂可包含交联剂或活化所形成的微滴内的交联剂的化学品。同样地,对于包含可聚合单体的聚合物前体,活化剂可包含聚合引发剂。举例来说,在某些情况下,在聚合物前体包含丙烯酰胺单体与N,N’-双-(丙烯酰基)胱胺(BAC)共聚单体的混合物的情况下,可将诸如四乙基亚甲基二胺(TEMED)等试剂提供于通道区段104和106中的第二流体流内,此引发丙烯酰胺和BAC共聚成交联聚合物网络或水凝胶。

在微滴的形成中在第二流体流116与第一流体流112在接头110处接触后,TEMED可从第二流体116扩散至包含线性聚丙烯酰胺的水性第一流体112中,其将活化微滴内的聚丙烯酰胺的交联,从而随着固体或半固体珠粒或粒子夹入细胞114而引起凝胶(例如水凝胶)微胶囊118的形成。虽然就聚丙烯酰胺封装进行了描述,但在本文所描述的方法和组合物的背景下还可采用其他‘可活化’封装组合物。举例来说,形成海藻酸盐微滴随后暴露于二价金属离子,例如Ca2+,可用作使用所描述的方法的封装过程。同样地,还可通过基于温度(例如在冷却后等)的凝胶化将琼脂糖微滴转化至胶囊中。如应了解,在一些情况下,封装细胞可例如通过时间的推移或在施加特定刺激后从微胶囊选择性地释放,所述特定刺激使微胶囊充分降解以允许细胞或其内容物从微胶囊释放至例如额外分区(诸如微滴)中。举例来说,在上文所描述的聚丙烯酰胺聚合物的情况下,可通过引入适当的还原剂(诸如DTT等)以裂解交联聚合物基质的二硫键来实现微胶囊的降解(参见例如2014年2月7日提交的美国临时专利申请号61/940,318、2014年5月9日提交的美国临时专利申请号61/991,018以及2014年6月26日提交的美国专利申请号14/316,383,所述美国专利申请的全部公开内容出于所有目的以全文引用的方式并入本文中。

如应了解,封装的细胞或细胞群体提供可储存和比基于微滴所分配的细胞更便携的某些潜在优点。此外,在一些情况下,可能需要允许所要分析的细胞孵育所选的一段时间,以在存在或不存在不同刺激的情况下表征此类细胞随时间的变化。在此类情况下,单个细胞的封装可允许比在乳液微滴中简单分配更久的孵育,不过在一些情况下,微滴分配的细胞还可被孵育不同的时间,例如至少10秒、至少30秒、至少1分钟、至少5分钟、至少10分钟、至少30分钟、至少1小时、至少2小时、至少5小时或至少10小时或更多的时间。如上文所提到,细胞的封装可构成将其他试剂共分配至其中的细胞分配。或者,封装的细胞可轻易地沉积至如上文所描述的其他分区(例如微滴)中。

根据某些方面,可将细胞与溶解试剂一起分配,以释放分区内的细胞的内容物。在此类情况下,可在例如通过额外通道或通道接头110上游的通道将细胞引入分配接头/微滴产生区中的同时,或在即将将细胞引入分配接头/微滴产生区中时使溶解剂与细胞悬浮液接触。溶解剂的实例包括生物活性试剂,诸如用于溶解不同细胞类型(例如革兰氏阳性(gram positive)或阴性细菌、植物、酵母、哺乳动物等)的溶解酶,诸如溶菌酶、无色肽酶、溶葡球菌酶、labiase、硫葡糖苷酶白芥子(kitalase)、溶壁酶(lyticase)以及可自例如Sigma-Aldrich,Inc.(St Louis,MO)获得的多种其他溶解酶以及其他可商购的溶解酶。可另外或替代地将其他溶解剂与细胞共分配以使得细胞的内容物释放至分区中。举例来说,在一些情况下,可使用基于表面活性剂的溶解溶液来溶解细胞,不过对于基于乳液的体系来说可能不太需要这些,在基于乳液的体系中表面活性剂可干扰稳定的乳液。在一些情况下,溶解溶液可包括非离子表面活性剂,诸如TritonX-100和吐温(Tween)20。在一些情况下,溶解溶液可包括离子表面活性剂,诸如十二烷基肌氨酸钠和十二烷基硫酸钠(SDS)。类似地,在某些情况下还可使用采用可使用的其他方法(诸如电穿孔、热、声或机械细胞破坏)的溶解方法,例如不基于乳液的分配,诸如除了微滴分配或替代微滴分配可使用的细胞封装,其中封装物的任何孔度足够小以在细胞破坏之后保留所需尺寸的核酸片段。

除了上文所描述的与细胞共分配的溶解剂,还可将其他试剂与细胞共分配,包括例如DNA酶和RNA酶灭活剂或抑制剂,诸如蛋白酶K;螯合剂,诸如EDTA;以及用于去除或以其他方式减少不同细胞溶解产物组分对核酸的后续处理的负面活性或影响的其他试剂。另外,在封装细胞的情况下,可使细胞暴露于适当的刺激以使细胞或其内容物从共分配的微胶囊释放。举例来说,在一些情况下,可将化学刺激与封装细胞一起共分配以允许微胶囊降解以及细胞或其内容物释放至更大的分区中。在一些情况下,此刺激可与本文中别处所描述用于使寡核苷酸从其各自的珠粒或分区释放的刺激相同。在替代的方面,此刺激可为不同并且不重叠的刺激,以允许封装的细胞在与寡核苷酸释放至分区中不同的时间释放至同一分区中。

可将额外试剂与细胞共分配,诸如用于将细胞的DNA片段化的核酸内切酶、用于扩增细胞的核酸片段和用于将条形码寡核苷酸连接至扩增过的片段的DNA聚合酶和dNTP。额外试剂还可包括反转录酶(包括具有末端转移酶活性的酶)、引物和寡核苷酸以及可用于模板转换的转换寡核苷酸(本文中也称为“转换oligo”)。在一些情况下,可使用模板转换来增加cDNA的长度。在模板转换的一个实例中,可由模板(例如细胞mRNA)的反转录产生cDNA,其中具有末端转移酶活性的反转录酶可将额外核苷酸(例如多聚胞苷酸)诸如在cDNA的末端添加至不由模板编码的cDNA。转换寡核苷酸可包括与额外核苷酸(例如多聚鸟苷酸)互补的序列。cDNA上的额外核苷酸(例如多聚胞苷酸)可与和转换寡核苷酸上的额外核苷酸互补的序列(例如多聚鸟苷酸)杂交,由此转换寡核苷酸可被反转录酶用作模板来进一步延伸cDNA。转换寡核苷酸可组成脱氧核糖核酸、核糖核酸、修饰过的核酸(包括锁核酸(LNA))或任何组合。

在一些情况下,转换寡核苷酸的长度可为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250个核苷酸或更长。

在一些情况下,转换寡核苷酸的长度可为至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249或250个核苷酸或更长。

在一些情况下,转换寡核苷酸的长度可为至多2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249或250个核苷酸。

一旦细胞的内容物释放至其各自的分区中,其中所含的核酸即可在分区内进一步被处理。根据本文所描述的方法和系统,通常为单个细胞的核酸内容物提供独特的标识,使得在表征那些核酸后,可将其归属为是源于相同的细胞。将特征归属于单个细胞或细胞群组的能力是通过将独特的标识特异性地分配至单个细胞或细胞群组来提供,此为本文所描述的方法和系统的另一有利方面。特定而言,分配例如呈核酸条形码形式的独特的标识或使其与单个细胞或细胞群体相关联,以用独特的标识标记(tag/label)细胞的组分(并且因此,标记其特征)。然后使用这些独特的标识来将细胞的组分和特征归属于单个细胞或细胞群组。在一些方面,这是通过将单个细胞或细胞群组与独特的标识共分配来进行。在一些方面,以包含核酸条形码序列的寡核苷酸的形式来提供独特的标识,所述核酸条形码序列可连接至或以其他方式与单个细胞的核酸内容物缔合,或连接至细胞的其他组分,并且特别是连接至那些核酸的片段。对寡核苷酸进行分配,使得在给定分区中的寡核苷酸之间,其中所含的核酸条形码序列是相同的,但在不同分区之间,寡核苷酸可并且确实具有不同的条形码序列,或至少在给定分析中在所有分区中呈现大量的不同的条形码序列。在一些方面,仅一个核酸条形码序列可与给定分区相关联,不过在一些情况下,可存在两个或更多个不同的条形码序列。

核酸条形码序列可在寡核苷酸的序列中包括6至约20或更多个核苷酸。在一些情况下,条形码序列的长度可为6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,条形码序列的长度可为至少6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,条形码序列的长度可为至多6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更短。这些核苷酸可为完全连续的,即呈单段相邻核苷酸的形式,或者它们可被分隔至由一个或多个核苷酸隔开的两个或更多个单独的子序列中。在一些情况下,隔开的条形码子序列的长度可为约4至约16个核苷酸。在一些情况下,条形码子序列可为4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下,条形码子序列可为至少4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下,条形码子序列可为至多4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更短。

共分配的寡核苷酸还可包含适用于处理来自共分配的细胞的核酸的其他功能序列。这些序列包括例如靶向型或随机/通用型扩增引物序列,其用于扩增分区内的单个细胞的基因组DNA,同时连接相关条形码序列;测序引物或引物识别位点、杂交或探测序列,例如用于识别序列的存在或用于向下拉动条形码化核酸;或许多其他潜在功能序列中的任一种。再次,寡核苷酸和相关条形码以及其他功能序列连同样品材料的共分配描述于例如2014年2月7日提交的美国专利申请号61/940,318和2014年5月9日提交的美国专利申请号61/991,018以及2014年6月26日提交的美国专利申请号14/316,383以及2014年2月7日提交的美国专利申请号14/175,935中,这些专利申请先前以引用的方式并入本文中。如应了解,还可采用其他共分配寡核苷酸的机制,包括例如两个或更多个微滴的聚结,其中一个微滴含有寡核苷酸;或将寡核苷酸微分配至分区中,例如微流体系统内的微滴。

简要地说,在一个实例中,提供珠粒、微粒子或微胶囊,其各自包括大量上文所描述的可释放地连接至珠粒的寡核苷酸,其中连接至特定珠粒的所有寡核苷酸将包括相同的核酸条形码序列,但其中在所用的珠粒群体中可呈现大量多样的条形码序列。在特别适用的实例中,使用例如包括聚丙烯酰胺聚合物基质的水凝胶珠粒作为寡核苷酸进入分区的固体支撑物和递送媒介物,因为它们能够承载大量的寡核苷酸分子,并且可被配置成如本文中别处所描述在暴露于特定刺激后释放那些寡核苷酸。在一些情况下,珠粒群体将提供多样的条形码序列文库,其包括至少1,000个不同的条形码序列、至少5,000个不同的条形码序列、至少10,000个不同的条形码序列、至少至少50,000个不同的条形码序列、至少100,000个不同的条形码序列、至少1,000,000个不同的条形码序列、至少5,000,000个不同的条形码序列或至少10,000,000个不同的条形码序列。另外,各珠粒可具备大量所连接的寡核苷酸分子。特定而言,单个珠粒上的包括条形码序列的寡核苷酸分子的数目可为至少1,000个寡核苷酸分子、至少5,000个寡核苷酸分子、至少10,000个寡核苷酸分子、至少50,000个寡核苷酸分子、至少100,000个寡核苷酸分子、至少500,000个寡核苷酸、至少1,000,000个寡核苷酸分子、至少5,000,000个寡核苷酸分子、至少10,000,000个寡核苷酸分子、至少50,000,000个寡核苷酸分子、至少100,000,000个寡核苷酸分子并且在一些情况下至少10亿个寡核苷酸分子。

此外,当珠粒群体被分配时,所得分区群体还可包括多样的条形码文库,其包括至少1,000个不同的条形码序列、至少5,000个不同的条形码序列、至少10,000个不同的条形码序列、至少至少50,000个不同的条形码序列、至少100,000个不同的条形码序列、至少1,000,000个不同的条形码序列、至少5,000,000个不同的条形码序列或至少10,000,000个不同的条形码序列。另外,群体的各个分区可包括至少1,000个寡核苷酸分子、至少5,000个寡核苷酸分子、至少10,000个寡核苷酸分子、至少50,000个寡核苷酸分子、至少100,000个寡核苷酸分子、至少500,000个寡核苷酸、至少1,000,000个寡核苷酸分子、至少5,000,000个寡核苷酸分子、至少10,000,000个寡核苷酸分子、至少50,000,000个寡核苷酸分子、至少100,000,000个寡核苷酸分子并且在一些情况下至少10亿个寡核苷酸分子。

在一些情况下,可能需要在给定分区内并入多个不同的条形码,连接至分区内的单一或多个珠粒。举例来说,在一些情况下,混合但已知的条形码序列集合例如通过提供条形码至给定分区的更强定址或归属作为对给定分区的输出的重复或独立确认而可在后续处理中提供更大的识别保证。

在对珠粒施加特定刺激后寡核苷酸可从珠粒释放。在一些情况下,刺激可为光刺激,例如通过释放寡核苷酸的光不稳定性键的裂解。在其他情况下,可使用热刺激,其中珠粒环境的温度升高可能会导致键的裂解或寡核苷酸从珠粒的其他释放。在其他情况下,使用化学刺激,其裂解寡核苷酸与珠粒的键联,或以其他方式使得寡核苷酸从珠粒释放。此类型的系统的实例描述于2013年8月13日提交的美国专利申请号13/966,150以及2014年2月7日提交的美国临时专利申请号61/940,318、2014年5月9日提交的美国临时专利申请号61/991,018以及2014年6月26日提交的美国专利申请号14/316,383中,所述专利申请的全部公开内容出于所有目的以全文引用的方式并入本文中。在一种情况下,此类组合物包括上文关于细胞封装所描述的聚丙烯酰胺基质,并且可通过暴露于还原剂(诸如DTT)而降解以释放所连接的寡核苷酸。

根据本文所描述的方法和系统,将包括所连接的寡核苷酸的珠粒与单个细胞共分配,使得单个分区内含有单一珠粒和单一细胞。如上文所提到,当单一细胞/单一珠粒占用为最需要的状态时,应了解,经常会存在多重占用分区(就细胞、珠粒或两者来说),或未占用分区(就细胞、珠粒或两者来说)。图2中示意性说明了用于对细胞和包含条形码寡核苷酸的珠粒进行共分配的微流体通道结构的实例。如本文中别处所描述,在一些方面,全部被占用的分区中相当大百分比将包括珠粒与细胞两者,并且在一些情况下,所产生的分区中的一些将未被占用。在一些情况下,分区中的一些可具有不是1:1分配的珠粒和细胞。在一些情况下,可能需要提供多重占用分区,例如在单一分区内含有两个、三个、四个或更多个细胞和/或珠粒。如图所示,以在通道接头212处流体连通的形式提供通道区段202、204、206、208以及210。使包含单个细胞的水性流214通过通道区段202流向通道接头212。如上文所描述,这些细胞可悬浮于水性流体内,或可在分配过程之前已被预封装。

同时,使包含条形码承载珠粒的水性流216通过通道区段204流向通道接头212。从侧通道206和208中的每一者将非水性分配流体216引入通道接头212中,并且使组合流流至出口通道210中。在通道接头212内,将来自通道区段202和204的两种组合水性流组合在一起,并且分配至微滴218中,所述微滴包括共分配的细胞214和珠粒216。如先前所提到,通过控制在通道接头212处组合的流体中的每一者的流动特征以及控制通道接头的几何结构,可优化组合和分配以在所产生的分区218内实现所要的珠粒、细胞或两者的占用水平。

在一些情况下,可将溶解剂(例如细胞溶解酶)与珠粒流一起引入分区中,例如通过通道区段204流动,使得细胞的溶解仅在分配时或分配后开始。还可将额外试剂添加至呈此配置的分区,诸如用于将细胞的DNA片段化的核酸内切酶、用于扩增细胞的核酸片段和用于将条形码寡核苷酸连接至扩增过的片段的DNA聚合酶和dNTP。如上文所提到,在许多情况下,可使用化学刺激(诸如DTT)来使条形码从其各自的珠粒释放至分区中。在此类情况下,可能特别需要将化学刺激与含细胞流一起提供于通道区段202中,使得条形码的释放仅在两种流已在例如分区218内组合之后发生。然而,在细胞被封装的情况下,例如使寡核苷酸从其珠粒释放并且使细胞从其微胶囊释放的共同化学刺激的引入通常可从通道接头212上游或与通道接头212连接的单独的额外侧通道(未示出)提供。

如应了解,可将许多其他试剂与细胞、珠粒、溶解剂以及化学刺激一起共分配,包括例如保护试剂,如蛋白酶K;螯合剂;核酸延伸、复制、转录或扩增试剂,诸如聚合酶、反转录酶、可用于基于转座子的方法中的转座酶(例如Nextera)、三磷酸核苷或NTP类似物、引物序列以及额外辅因子(诸如用于此类反应中的二价金属离子)、连接反应试剂(诸如连接酶和连接序列);染料、标记物或其他标记试剂。

例如如本文所描述的通道网络可流体偶接至适当的流体组件。举例来说,入口通道区段(例如通道区段202、204、206以及208)流体偶接至它们要递送至通道接头212的适当的材料来源。举例来说,通道区段202将流体偶接至所要分析的细胞水性悬浮液214的来源,而通道区段204将流体偶接至珠粒水性悬浮液216的来源。然后,通道区段206和208将流体连接至非水性流体的一个或多个来源。这些来源可包括从微流体装置的主体结构中所限定或与微流体装置的主体结构连接的简单储集器到递送来自装置外来源、歧管的流体的流体导管等多种不同流体组件中的任一种。同样地,出口通道区段210可流体偶接至所分配的细胞的接收容器或导管。再次,此可为微流体装置的主体中所限定的储集器,或其可为用于将所分配的细胞递送至后续工艺操作、仪器或组件的流体导管。

图8示出了单个Jurkat细胞与含有条形码寡核苷酸的珠粒一起共分配于油包水乳液中的水性微滴中的图像。如图所示,单个细胞可容易地与单个珠粒共分配。如应了解,可通过许多方法来进行单个细胞加载的优化,包括通过将细胞群体的稀释液提供至微流体系统中以如本文中别处所描述实现每个分区的所需细胞加载。

在操作中,一旦被溶解,单个细胞的核酸内容物即可然后用于在分区内进一步处理,包括例如片段化、扩增以及条形码化,以及其他功能序列的连接。如上文所提到,可通过剪切酶(诸如核酸内切酶)的共分配来实现片段化,以将核酸片段化更小的片段。这些核酸内切酶可包括限制性核酸内切酶,包括II型和IIs型限制性核酸内切酶以及其他核酸裂解酶,诸如切刻核酸内切酶(nicking endonuclease)等。在一些情况下,可能不需要片段化,并且可将全长核酸保留在分区内,或在封装的细胞或细胞内容物的情况下,可在分配之前例如通过酶促方法(例如本文所描述的那些)或通过机械方法(例如机械、声学或其他剪切)进行片段化。

一旦共分配并且细胞被溶解以释放其核酸,即可使用设置于珠粒上的寡核苷酸来对那些核酸的片段进行条形码化和扩增。一种特别简捷的在对样品核酸的片段进行扩增和条形码化时使用这些条形码寡核苷酸的方法详细描述于2014年2月7日提交的美国临时专利申请号61/940,318、2014年5月9日提交的61/991,018以及2014年6月26日提交并且先前以引用的方式并入的美国专利申请号14/316,383中。简要地说,在一个方面,存在于与细胞共分配的珠粒上的寡核苷酸从其珠粒与细胞的核酸一起被释放至分区中。寡核苷酸可(连同条形码序列一起)在其5’端包括引物序列。此引物序列可为意在随机引导细胞的核酸的许多不同区域的随机寡核苷酸序列或其可为以引导细胞的基因组的特定靶向区域的上游为目标的特定引物序列。

一旦被释放,寡核苷酸的引物部分即可与细胞的核酸的互补区域退火。也与细胞和珠粒共分配的延伸反应试剂(例如DNA聚合酶、三磷酸核苷、辅因子(例如Mg2+或Mn2+))然后使用细胞的核酸作为模板延伸引物序列,以产生与引物退火的细胞的核酸的链的互补片段,所述互补片段包括寡核苷酸和其相关条形码序列。多个引物与细胞的核酸的不同部分的退火和延伸将产生核酸的重叠互补片段的大型汇集物,所述重叠互补片段各自具有其自己的指示其在其中形成的分区的条形码序列。在一些情况下,这些互补片段本身可用作模板,所述模板由存在于分区中的寡核苷酸引导以产生互补序列的互补序列,其又包括条形码序列。在一些情况下,此复制过程被配置为使得当第一互补序列重复时,其产生位于或靠近其末端的两个互补序列,以允许形成发夹结构或部分发夹结构,从而降低所述分子成为产生其他重复拷贝的基础的能力。如本文所描述,细胞的核酸可包括细胞内的任何所需核酸,包括例如细胞的DNA(例如基因组DNA)、RNA(例如信使RNA)等。举例来说,在一些情况下,使用本文所描述的方法和系统来表征所表达的mRNA,包括例如此类mRNA的存在和量化,并且可包括RNA测序方法作为表征方法。或者或另外,与细胞一起分配的试剂可包括用于将mRNA转化成cDNA的试剂,例如反转录酶;以及用于促进采用DNA测序的测序方法的试剂。在一些情况下,在所要表征的核酸包括RNA,例如mRNA的情况下,图3中示出了对此情况的一个实例的示意性说明。

如图所示,将包括条形码序列的寡核苷酸与样品核酸304一起共分配于例如乳液中的微滴302中。如本文中别处所提到,如图A中所示,寡核苷酸308可提供于与样品核酸304共分配的珠粒306上,所述寡核苷酸可从珠粒306释放。寡核苷酸308除一个或多个功能序列(例如序列310、314以及316)之外还包括条形码序列312。举例来说,寡核苷酸308被示出为包含条形码序列312以及可充当给定测序系统的连接或固定序列的序列310,例如用于在Illumina

如应了解,在一些情况下,功能序列可包括适用于RNA-seq应用的引物序列。举例来说,在一些情况下,寡核苷酸可包括用于引导用于RNA-seq的RNA反转录的多聚胸苷酸引物。在其他情况下,在给定分区中例如包括于单个珠粒上的寡核苷酸除了共同的条形码序列还可包括多种类型的引物序列,诸如DNA-测序与RNA测序引物,例如包括在与珠粒偶接的寡核苷酸内的多聚胸苷酸引物序列。在此类情况下,可对单一分配的细胞进行DNA与RNA测序过程。

基于存在引物序列316,寡核苷酸可如图B中所示引导样品核酸,这允许使用也与珠粒306和样品核酸304共分配的聚合酶和其他延伸试剂来延伸寡核苷酸308和308a。如图C中所示,在对于随机N-mer引物来说将与样品核酸304的多个不同区域退火的寡核苷酸延伸之后;形成核酸的多个重叠互补序列或片段,例如片段318和320。虽然包括与样品核酸的数个部分互补的序列部分,例如序列322和324,但是这些构建体在本文中通常被称为包含样品核酸304中具有连接的条形码序列的片段。

然后可例如通过序列分析对条形码化核酸片段进行表征,或可以如在图D中所示的过程将其进一步扩增。举例来说,也从珠粒306释放的额外寡核苷酸(例如寡核苷酸308b)可引导片段318和320。针对片段318示出了此情况。特定而言,再次,基于随机N-mer引物316b存在于寡核苷酸308b中(这在许多情况下可不同于给定分区中的其他随机N-mer,例如引物序列316),寡核苷酸与片段318退火,并且延伸以形成片段318中包括序列328的至少一部分的互补序列326,其包含样品核酸序列的一部分的重复。寡核苷酸308b继续延伸直到它已通过片段318的寡核苷酸部分308复制。如本文中别处所提到,并且如图D中所说明,寡核苷酸可被配置成提示通过聚合酶进行的复制在所需点停止,例如在通过寡核苷酸308的包括在片段18内的序列316和>314复制之后停止。如本文所描述,这可通过不同的方法来实现,包括例如并入不能由所用的聚合酶处理的不同核苷酸和/或核苷酸类似物。举例来说,这可包括在序列区域312内纳入含尿嘧啶的核苷酸来防止非尿嘧啶耐受型聚合酶使所述区域的复制停止。结果,形成片段326,其在一个末端包括全长寡核苷酸308b,包括条形码序列312、连接序列310、R1引物区314以及随机N-mer序列316b。在序列的另一个末端可包括第一寡核苷酸308的随机N-mer的互补序列316’,以及整个或一部分的R1序列的互补序列(以序列314’示出)。R1序列314和其互补序列314’然后能够杂交在一起以形成部分发夹结构328。如应了解,因为不同寡核苷酸之间的随机N-mer不同,这些序列和其互补序列预期不会参与发夹形成,例如序列316’(其为随机N-mer316的互补序列)预期不会与随机N-mer序列316b互补。对于其他应用来说不会是这种情况,例如靶向型引物,其中在给定分区内寡核苷酸之间的N-mer将为共同的。

通过形成这些部分发夹结构,允许从进一步的复制中去除样品序列的第一级重复,从而例如防止拷贝的重复拷贝。部分发夹结构还提供所形成的片段(例如片段326)的后续处理的有用结构。

一般来说,进行细胞的核酸的扩增直到分区内的条形码化重叠片段构成特定部分或全部的细胞基因组的至少1X的覆盖、基因组或其所关注的相关部分的至少2X、至少3X、至少4X、至少5X、至少10X、至少20X、至少40X或更大的覆盖。一旦产生条形码化片段,即可在适当测序系统(例如Illumina

然后可从多个不同分区汇集所有片段以便在如本文所描述的高通量测序仪上进行测序,其中所汇集的片段包括源于不同细胞或较小细胞群体的核酸的大量片段,但其中来自给定细胞的核酸的片段将共享相同的条形码序列。特定而言,因为各片段是关于其起源分区并且因此其单一细胞或小细胞群体而编码,所以可基于条形码的存在将所述片段的序列归属回到那个细胞或那些细胞,此也将帮助将来自多个分区的各个序列片段应用于不同细胞的单个基因组的组装。图4中对此进行了示意性说明。如一个实例中所示,如上文所描述,将来自第一细胞400的第一核酸404和来自第二细胞402的第二核酸406各自与其自己的条形码寡核苷酸的集合一起分配。核酸可包括染色体、整个基因组或来自细胞的其他大核酸。

在各分区内,各细胞的核酸404和406然后被处理以单独提供第一片段的重叠第二片段集合,例如第二片段集合408和410。此处理还提供第二片段,其中来源于特定第一片段的第二片段中的每一者的条形码序列是相同的。如图所示,第二片段集合408的条形码序列由“1”表示,而片段集合410的条形码序列由“2”表示。可使用多样的条形码文库来区别地条形码化大量不同片段集合。然而,没有必要用不同的条形码序列来条形码化来自不同第一片段的每一个第二片段集合。事实上,在许多情况下,可同时处理多个不同的第一片段以包括相同的条形码序列。本文在别处详细描述了多样的条形码文库。

然后可汇集例如来自片段集合408和410的条形码化片段,以便使用例如通过可从Thermo Fisher,Inc.的Illumina或Ion Torrent分公司获得的合成技术获得的序列进行测序。一旦经过测序,即可将序列读段412至少部分基于所包括的条形码并且在一些情况下部分基于其片段的序列而归属于其各自的片段集合,例如如聚集读段414和416中所示。然后组装被归属于各片段集合的序列读段以提供各细胞的核酸的组装序列,例如序列418和420,所述组装序列又可被归属于单个细胞,例如细胞400和402。

虽然就分析存在于细胞内的基因材料进行了描述,但本文所描述的方法和系统可具有广泛得多的适用性,包括通过允许将试剂分派至单个细胞并且响应于那些试剂提供对那些细胞的可分派的分析或表征而表征单个细胞或细胞群体的其他方面的能力。这些方法和系统在能够出于例如研究、诊断、病原识别以及许多其他原因而对细胞进行表征方面特别有价值。举例来说,广泛范围的不同细胞表面特征物(例如细胞表面蛋白,如分化或CD蛋白簇)在如癌症等疾病的表征中具有显著诊断相关性。

在一种特别适用的应用中,可使用本文所描述的方法和系统来表征细胞特征,诸如细胞表面特征物,例如蛋白质、受体等。特定而言,可使用本文所描述的方法来将报告分子附接于这些细胞特征,在如上文所描述对其进行分配时,可例如使用DNA测序技术进行条形码化和分析,以确定在单个细胞或细胞群体内此类细胞特征的存在并且在一些情况下确定其相对丰度或量。

在一个特定实例中,可提供与第一组核酸报告分子缔合的潜在细胞结合配体(例如抗体、抗体片段、细胞表面受体结合分子等)的文库,例如其中不同报告寡核苷酸序列与特定配体缔合,并且因此能够结合于特定细胞表面特征物。在一些方面,文库的不同成员可通过不同寡核苷酸序列标记物的存在来表征,例如第一种类型的细胞表面蛋白或受体的抗体将与其第一已知报告寡核苷酸序列缔合,而第二受体蛋白的抗体将具有不同的与其缔合的已知报告寡核苷酸序列。在共分配之前,会将细胞与配体文库一起孵育,所述配体文库可将抗体呈现给广泛范围的不同细胞表面特征物,例如受体、蛋白质等,并且其包括其所缔合的报告寡核苷酸。从细胞洗涤未结合的配体,并且然后将细胞与上文所描述的条形码寡核苷酸一起共分配。因此,分区将包括一个或多个细胞以及结合的配体和其已知缔合的报告寡核苷酸。

不需要在分区内溶解细胞,然后可对报告寡核苷酸进行上文关于细胞核酸所描述的条形码化操作,以产生条形码化报告寡核苷酸,其中报告寡核苷酸的存在可指示特定细胞表面特征物的存在,并且条形码序列将允许基于与所述细胞或细胞群体共分配的条形码序列将所述范围的不同细胞表面特征物归属于给定单个细胞或细胞群体。因此,可在更广泛的细胞群体内产生逐个细胞的细胞表面特征物型态。下文更详细描述了本文所描述的方法和系统的此方面。

图5中示意性说明了此实例。如图所示,将由细胞502和504代表的细胞群体与细胞表面缔合试剂(例如抗体、细胞表面结合蛋白、配体等)的文库一起孵育,其中各种不同类型的结合基包括以配体和相关报告分子506、508、510以及512(其中报告分子由不同阴影的圆形来指示)形式示出的与其缔合的相关核酸报告分子。在细胞表达由文库结合的表面特征的情况下,配体和其相关报告分子可变得与细胞表面缔合或偶接。然后将单个细胞与其相关配体/报告分子以及如本文中别处所描述的单个条形码寡核苷酸珠粒(例如珠粒522和524)分别一起分配至单独分区(例如微滴514和516)中。如在本文所描述的其他实例的情况下,使条形码化寡核苷酸从珠粒释放,并且用于将条形码序列连接至各分区内存在的报告分子,其中给定分区的条形码为共同的,但不同分区之间的条形码大大不同。举例来说,如图5中所示,将与分区514中的细胞502缔合的报告分子用条形码序列518条形码化,同时将与分区516中的细胞504缔合的报告分子用条形码520条形码化。因此,具备寡核苷酸文库,其反映如由报告分子所反映的细胞的表面配体,但其凭借共同的条形码序列大体上可归属于单个细胞,从而允许细胞的表面特征的单一细胞水平型态分析。如应了解,此方法不限于细胞表面受体,但可用于识别多种特定细胞结构、化学或其他特征的存在。

III.单一细胞分析的应用

本文所描述的单一细胞处理和分析方法和系统存在多种不同应用,包括用于环境、人健康、流行病学法医或多种不同应用中的任一种的特定单个细胞的分析、不同细胞类型的群体内的不同细胞类型的分析、较大细胞群体的分析和表征。

本文所描述的单一细胞分析方法的一种特别有价值的应用是对癌细胞进行测序和表征。特定而言,常规的分析技术(包括上文所提到的整体测序方法)非常不擅长挑出癌细胞的基因组构成中的较小变异,特别是在那些变化存在于大量正常组织细胞中的情况下。此外,甚至在肿瘤细胞之间,也会存在大的变异,并且可由用于测序的整体方法掩盖(参见例如Patel等,Single-cell RNA-seq highlights intratumoral heterogeneity inprimary glioblastoma,Science DOI:10.1126/science.1254257(2014年6月12日网上公布)。癌细胞可源于实体肿瘤、血液恶性肿瘤细胞系,或以循环肿瘤细胞的形式获得,并且经受上文所描述的分配过程。在分析时,可将单一细胞序列识别为源于单个细胞或小细胞群组,并且将其与正常组织细胞序列区分开。此外,如2014年6月26日提交的全部公开内容出于所有目的以全文引用的方式并入本文中的共同未决的美国临时专利申请号62/017,808中所描述,还可由各细胞获得相位序列信息(phased sequence information),从而允许更清楚地表征癌细胞内的单倍型变体。如2014年6月26日提交的全部公开内容出于所有目的以全文引用的方式并入本文中的共同未决的美国临时专利申请号62/017,580中所描述,单一细胞分析方法特别适用于涉及低输入核酸量的系统和方法。

如在癌细胞分析的情况下,使用常规技术通过胎儿细胞的分析对胎儿健康或异常的分析和诊断是一项困难的任务。特定而言,在不存在相对侵入性程序的情况下,诸如获得胎儿细胞样品的羊膜穿刺术可采用从母体循环收获那些细胞。如应了解,此类循环胎儿细胞构成所述循环的整个细胞群体中的极小部分。因此,进行复杂的分析以表征所获得的数据中什么可能是源于胎儿细胞而不是母体细胞。然而,通过采用本文所描述的单一细胞表征方法和系统,可将基因构成归属于单个细胞,并且将那些细胞基于其各自的基因构成归类为母体或胎儿。此外,可使用胎儿细胞的基因序列来识别许多基因病症中的任一种,包括例如非整倍性,诸如唐氏综合征(Down syndrome)、爱德华兹综合征(Edwards syndrome)以及帕韬氏综合征(Patau syndrome)。

表征来自细胞的较大多样群体的单个细胞的能力也在环境测试以及法医分析中具有显著价值,其中样品可在其本质上由细胞的多样群体和相对于样品中正在被测试的细胞(例如针对例如环境和食品安全测试的环境指示生物体、有毒生物体等;针对性侵犯以及其他暴力犯罪的法医分析中的受害者和/或行凶者细胞;等)“污染”样品的其他材料构成。

上文所描述的单一细胞测序和表征方法的额外适用应用在神经科学研究和诊断的领域内。特定而言,神经细胞可包括长散在核元件(LINE)或可在基因组中到处移动的‘跳跃’基因,此使得各神经元不同于其相邻细胞。研究已表明,人脑部的LINE的数目超过其他组织,例如心脏和肝脏组织,并且具有80与300个之间的独特插入(参见例如Coufal,N.G.等.Nature460,1127–1131(2009))。这些差异已被假定为与人的对神经学病症的敏感性有关(参见例如Muotri,A.R.等.Nature468,443–446(2010)),或为脑部提供多样性,以此来对激发作出反应。因此,可使用本文所描述的方法对单个神经细胞进行测序和表征。

如上文所提到,本文所描述的单一细胞分析方法还适用于就RNA转录物的识别和其定量来说对基因表达进行分析。特定而言,使用本文所描述的单一细胞水平分析方法,可分离和分析存在于单个细胞、细胞群体或细胞群体的子集中的RNA转录物。特定而言,在一些情况下,条形码寡核苷酸可被配置成引导、复制来自单个细胞的RNA以及因此产生其条形码化片段。举例来说,在一些情况下,条形码寡核苷酸可包括mRNA特异性引导序列,例如允许在反转录反应中引导和复制mRNA的多聚胸苷酸引物区段或其他靶向型引导序列。或者或另外,可使用条形码寡核苷酸的随机N-mer引物区段来进行随机RNA引导。

图6提供用于使用本文所描述的方法在单个细胞中进行RNA表达分析的一种示例性方法的示意图。如图所示,在操作602处,对含有细胞的样品进行活细胞分选,对其进行量化并且稀释用于后续分配。在操作604处,将单个细胞单独地与如本文所描述带有条形码化寡核苷酸的凝胶珠粒共分配。在操作606处,将细胞溶解,并且使条形码化寡核苷酸释放至分区中,其中在操作608处,它们例如凭借与mRNA的多聚腺苷酸尾互补的多聚胸苷酸引物序列与mRNA反应并且与mRNA杂交。使用多聚胸苷酸条形码寡核苷酸作为引导序列,在操作610处进行反转录反应以合成mRNA的cDNA转录物,其包括条形码序列。然后在操作612处例如使用PCR方法使条形码化的cDNA转录物额外扩增,在操作614处进行纯化,然后将其放置于核酸测序系统上以测定cDNA序列和其相关条形码序列。在一些情况下,如图所示,操作602至608可在试剂保持在其原始微滴或分区中时进行,而操作612至616可在主体中(例如在分区外)进行。在分区为乳液中的微滴的情况下,可将乳液破坏并且汇集微滴的内容物以完成操作612至616。在一些情况下,可在将乳液破坏之后用核酸外切酶消化条形码寡核苷酸。可在引物消化之后由乙二胺四乙酸(EDTA)引发核酸外切酶活性。在一些情况下,可在分区内基于反转录混合物(例如反转录酶和相关试剂)的共分配来进行操作610,或其可在主体中进行。

如本文中别处所提到,条形码寡核苷酸的结构除了寡核苷酸条形码序列还可包括许多序列元件。图7中示出了条形码寡核苷酸用于如上文所描述的RNA分析中的一个实例。如图所示,使整个寡核苷酸702通过可释放键联706(诸如二硫接头)与珠粒704偶接。寡核苷酸可包括用于后续处理的功能序列,诸如功能序列708,其可包括测序仪专用流动细胞连接序列(例如用于Illumina测序系统的P5序列)以及测序引物序列(例如用于Illumina测序系统的R1引物)中的一者或多者。用于条形码化样品RNA的结构内包括条形码序列710。寡核苷酸结构中还包括mRNA特异性引导序列(诸如多聚胸苷酸序列712)。可包括锚定序列区段714以确保多聚胸苷酸序列在mRNA的序列末端处杂交。此锚定序列可包括核苷酸的随机短序列,例如1-mer、2-mer、3-mer或更长的序列,此将确保多聚胸苷酸区段更可能在mRNA的多聚腺苷酸尾的序列末端处杂交。可在寡核苷酸序列内提供额外序列区段716。在一些情况下,此额外序列提供独特的分子序列区段例如作为随机序列(例如随机N-mer序列),所述随机序列在与单一珠粒偶接的单个寡核苷酸之间不同,而条形码序列710在连接至单个珠粒的寡核苷酸之间可为恒定的。此独特序列用以提供被捕获的起始mRNA分子的独特标识,以允许对最初表达的RNA的数目进行定量。如应了解,虽然被示出为连接至珠粒表面的单一寡核苷酸,但单个珠粒可包括数十至成千上万或甚至数百万的单个寡核苷酸分子,其中如所提到,对于给定珠粒来说条形码区段可为恒定的或相对恒定的,但其中在单个珠粒之间可变或独特的序列区段将不同。此独特分子序列区段可包括寡核苷酸的序列内的5至约8或更多个核苷酸。在一些情况下,独特分子序列区段的长度可为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸或更长。在一些情况下,独特分子序列区段的长度可为至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸或更长。在一些情况下,独特分子序列区段的长度可为至多2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸或更短。

在操作中,并且参考图6和7,将细胞与带条形码的珠粒一起共分配,并且溶解,同时使条形码化寡核苷酸从珠粒释放。释放的条形码寡核苷酸的多聚胸苷酸部分然后与mRNA的多聚腺苷酸尾杂交。多聚胸苷酸区段然后引导mRNA的反转录以产生mRNA的cDNA转录物,但其包括条形码寡核苷酸的序列区段708-716中的每一者。再次,因为寡核苷酸702包括锚定序列714,所以其将更可能与mRNA的多聚腺苷酸尾杂交并且在mRNA的多聚腺苷酸尾的序列末端引导反转录。在任何给定分区内,单个mRNA分子的所有cDNA转录物将包括共同的条形码序列区段710。然而,通过包括独特的随机N-mer序列,在给定分区内由不同mRNA分子得到的转录物在此独特序列处将不同。此提供甚至在给定分区的内容物的任何后续扩增之后仍可识别的定量特征,例如与共同条形码相关的独特区段的数目可指示来源于单一分区并且因此来源于单个细胞的mRNA的量。如上文所提到,然后将转录物扩增,清理并且测序以识别mRNA的cDNA转录物的序列,并且对条形码区段和独特的序列区段进行测序。

如本文中别处所提到,虽然描述了多聚胸苷酸引物序列,但是其他靶向型或随机引导序列也可用于引导反转录反应。同样地,虽然被描述为使条形码化寡核苷酸与溶解细胞的内容物一起释放至分区中,但是应了解,在一些情况下,可使用凝胶珠粒结合的寡核苷酸来杂交mRNA并且将其捕获于凝胶珠粒的固相上,以促进RNA与其他细胞内容物分离。

图9A中示出了用于包括信使RNA(mRNA,包括从细胞获得的mRNA)分析的RNA分析中的条形码寡核苷酸的额外实例。如图所示,可使整个寡核苷酸902通过可释放键联906(诸如二硫接头)与珠粒904偶接。寡核苷酸可包括用于后续处理的功能序列,诸如功能序列908,其可包括测序仪专用流动细胞连接序列,例如用于Illumina测序系统的P5序列;以及功能序列910,其可包括测序引物序列,例如用于Illumina测序系统的R1引物结合位点。用于条形码化样品RNA的结构内包括条形码序列912。寡核苷酸结构中还包括RNA特异性(例如,mRNA特异性)引导序列,诸如多聚胸苷酸序列914。可包括锚定序列区段(未示出)以确保多聚胸苷酸序列在mRNA的序列末端处杂交。可在寡核苷酸序列内提供额外序列区段916。此额外序列可提供独特的分子序列区段,例如作为随机N-mer序列,所述随机N-mer序列在与单一珠粒偶接的单个寡核苷酸之间不同,而条形码序列912在连接至单个珠粒的寡核苷酸之间可为恒定的。如本文中别处所描述,此独特序列可用以提供所捕获的起始mRNA分子的独特标识,以允许对最初表达的RNA数目的定量,例如mRNA计数。如应了解,虽然被示出为连接至珠粒表面的单一寡核苷酸,但单个珠粒可包括数十至成千上万或甚至数百万的单个寡核苷酸分子,其中如所提到,对于给定珠粒来说条形码区段可为恒定的或相对恒定的,但其中在单个珠粒之间可变或独特的序列区段将不同。

在细胞RNA(例如mRNA)分析的示例性方法中并且参考图9A,将细胞与带条形码的珠粒、转换oligo 924以及其他试剂(诸如反转录酶、还原剂以及dNTP)一起共分配至分区(例如乳液中的微滴)中。在操作950中,将细胞溶解,同时使条形码化寡核苷酸902从珠粒释放(例如经由还原剂的作用),并且所释放的条形码寡核苷酸的多聚胸苷酸区段914然后与从细胞释放的mRNA 920的多聚腺苷酸尾杂交。接着,在操作952中,多聚胸苷酸区段914在反转录反应中使用mRNA作为模板来延伸以产生与mRNA互补的cDNA转录物922,并且还包括条形码寡核苷酸的序列区段908、912、910、916以及914中的每一者。反转录酶的末端转移酶活性可将额外碱基添加至cDNA转录物(例如,多聚胞苷酸)。转换寡核苷酸924可然后与添加至cDNA转录物的额外碱基杂交并且促进模板转换。然后可经由使用转换寡核苷酸924作为模板来延伸cDNA转录物922而将与转换寡核苷酸序列互补的序列并入cDNA转录物922中。在任何给定分区内,单个mRNA分子的所有cDNA转录物将包括共同的形码序列区段912。然而,通过包括独特的随机N-mer序列916,在给定分区内由不同mRNA分子得到的转录物在此独特序列处将不同。如本文中别处所描述,此提供甚至在给定分区的内容物的任何后续扩增之后仍可识别的定量特征,例如与共同条形码相关的独特区段的数目可指示来源于单一分区并且因此来源于单一细胞的mRNA的量。在操作952之后,然后在操作954中用引物926(例如,PCR引物)扩增cDNA转录物922。接着,然后在操作956中将扩增产物纯化(例如,经由固相可逆固定(SPRI))。在操作958处,然后将扩增产物剪切,连接至额外功能序列,并且进一步扩增(例如,经由PCR)。功能序列可包括测序仪专用流动细胞连接序列930,例如用于Illumina测序系统的P7序列;以及功能序列928,其可包括测序引物结合位点,例如针对用于Illumina测序系统的R2引物;以及功能序列932,其可包括样品索引,例如用于Illumina测序系统的i7样品索引序列。在一些情况下,操作950和952可在分区中进行,而操作954、956以及958可在主体溶液中(例如在分区外的汇集混合物中)进行。在分区为乳液中的微滴的情况下,可将乳液破坏并且汇集微滴的内容物以完成操作954、956以及958。在一些情况下,操作954可在分区内完成。在一些情况下,可在将乳液破坏之后用核酸外切酶消化条形码寡核苷酸。可在引物消化之后由乙二胺四乙酸(EDTA)引发核酸外切酶活性。虽然就用于某些测序系统(例如Illumina系统)的特定序列参考物进行了描述,但应了解,参考这些序列仅是出于说明目的,并且本文所描述的方法可被配置成与其他测序系统一起使用,所述其他测序系统并有用于那些系统(例如可从Ion Torrent、Oxford Nanopore、Genia、PacificBiosciences、Complete Genomics等获得的系统)中的特定引导、连接、索引以及其他操作序列。

在如图9A中所示用于RNA(例如细胞RNA)分析的条形码寡核苷酸的替代实例中,功能序列908可为P7序列,并且功能序列910可为R2引物结合位点。此外,对于Illumina测序系统,功能序列930可为P5序列、功能序列928可为R1引物结合位点,并且功能序列932可为i5样品索引序列。由此类条形码寡核苷酸产生的构建体的配置可帮助最小化(或避免)在测序期间对多聚胸苷酸序列的测序。

图9B中示出了用于RNA分析(包括细胞mRNA分析)的另一示例性方法。在此方法中,将转换寡核苷酸924与单个细胞和条形码化珠粒连同诸如反转录酶、还原剂以及dNTP等试剂共分配至分区(例如,乳液中的微滴)中。可用额外标签934(例如生物素)标记转换寡核苷酸924。在操作951中,将细胞溶解,同时使条形码化寡核苷酸902(例如如图9A中所示)从珠粒释放(例如,经由还原剂的作用)。在一些情况下,序列908为P7序列,并且序列910为R2引物结合位点。在其他情况下,序列908为P5序列,并且序列910为R1引物结合位点。接着,所释放的条形码寡核苷酸的多聚胸苷酸区段914与从细胞释放的mRNA 920的多聚腺苷酸尾杂交。在操作953中,多聚胸苷酸区段914然后在反转录反应中使用mRNA作为模板来延伸以产生与mRNA互补的cDNA转录物922,并且还包括条形码寡核苷酸的序列区段908、912、910、916以及914中的每一者。反转录酶的末端转移酶活性可将额外碱基添加至cDNA转录物(例如,多聚胞苷酸)。转换寡核苷酸924可然后与cDNA转录物杂交并且促进模板转换。然后可经由使用转换寡核苷酸924作为模板来延伸cDNA转录物922而将与转换寡核苷酸序列互补的序列并入cDNA转录物922中。接着,可使用分离操作960来从分区中的试剂和寡核苷酸中分离cDNA转录物922。可使额外标签934(例如生物素)与相互作用的标签936(例如链霉亲和素)接触,所述相互作用的标签可被连接至磁性珠粒938。在操作960处,可使用向下拉动的操作(例如,经由磁性分离、离心)来分离cDNA,然后在操作955中扩增(例如,经由PCR),随后在操作957中纯化(例如,经由固相可逆固定(SPRI)),并且在操作959中进一步处理(剪切;序列928、932以及930的连接;以及后续扩增(例如,经由PCR))。在序列908为P7序列并且序列910为R2引物结合位点的一些情况下,序列930为P5序列,并且序列928为R1引物结合位点,并且序列932为i5样品索引序列。在序列908为P5序列并且序列910为R1引物结合位点的一些情况下,序列930为P7序列,并且序列928为R2引物结合位点,并且序列932为i7样品索引序列。在一些情况下,如图所示,操作951和953可在分区内进行,而操作960、955、957以及959可在主体溶液中(例如,在分区外的汇集混合物中)进行。在分区为乳液中的微滴的情况下,将乳液破坏并且汇集微滴的内容物以完成操作960。然后可在操作960之后在汇集转录物以便处理之后进行操作955、957以及959。

图9C中示出了用于RNA分析(包括细胞mRNA分析)的另一示例性方法。在此方法中,将转换寡核苷酸924与单个细胞和条形码化珠粒连同诸如反转录酶、还原剂以及dNTP等试剂共分配于分区(例如乳液中的微滴)中。在操作961中,将细胞溶解,同时使条形码化寡核苷酸902(例如如图9A中所示)从珠粒释放(例如,经由还原剂的作用)。在一些情况下,序列908为P7序列,并且序列910为R2引物结合位点。在其他情况下,序列908为P5序列,并且序列910为R1引物结合位点。接着,所释放的条形码寡核苷酸的多聚胸苷酸区段914然后与从细胞释放的mRNA 920的多聚腺苷酸尾杂交。接着,在操作963中,多聚胸苷酸区段914然后在反转录反应中使用mRNA作为模板来延伸以产生与mRNA互补的cDNA转录物922,并且还包括条形码寡核苷酸的序列区段908、912、910、916以及914中的每一者。反转录酶的末端转移酶活性可将额外碱基添加至cDNA转录物(例如,多聚胞苷酸)。转换寡核苷酸924可然后与cDNA转录物杂交并且促进模板转换。然后可经由使用转换寡核苷酸924作为模板来延伸cDNA转录物922而将与转换寡核苷酸序列互补的序列并入cDNA转录物922中。在操作961和操作963之后,在操作962中使mRNA 920和cDNA转录物922变性。在操作964处,使第二链从具有额外标签942(例如生物素)的引物940延伸,并且与cDNA转录物922杂交。还在操作964中,可使生物素标记过的第二链与相互作用的标签936(例如链霉亲和素)接触,所述相互作用的标签可被连接至磁性珠粒938。可使用向下拉动的操作(例如,经由磁性分离、离心)来分离cDNA,然后在操作965中扩增(例如,经由聚合酶链式反应(PCR)),随后在操作967中纯化(例如,经由固相可逆固定(SPRI)),并且在操作969中进一步处理(剪切;序列928、932以及930的连接;以及后续扩增(例如,经由PCR))。在序列908为P7序列并且序列910为R2引物结合位点的一些情况下,序列930为P5序列,并且序列928为R1引物结合位点,并且序列932为i5样品索引序列。在序列908为P5序列并且序列910为R1引物结合位点的一些情况下,序列930为P7序列,并且序列928为R2引物结合位点,并且序列932为i7样品索引序列。在一些情况下,操作961和963可在分区中进行,而操作962、964、965、967以及969可在主体中(例如在分区外)进行。在分区为乳液中的微滴的情况下,可将乳液破坏并且汇集微滴的内容物以完成操作962、964、965、967以及969。

图9D中示出了用于RNA分析(包括细胞mRNA分析)的另一示例性方法。在此方法中,将转换寡核苷酸924与单个细胞和条形码化珠粒连同诸如反转录酶、还原剂以及dNTP等试剂共分配。在操作971中,将细胞溶解,同时使条形码化寡核苷酸902(例如,如图9A中所示)从珠粒释放(例如,经由还原剂的作用)。在一些情况下,序列908为P7序列,并且序列910为R2引物结合位点。在其他情况下,序列908为P5序列,并且序列910为R1引物结合位点。接着,所释放的条形码寡核苷酸的多聚胸苷酸区段914然后与从细胞释放的mRNA 920的多聚腺苷酸尾杂交。接着,在操作973中,多聚胸苷酸区段914然后在反转录反应中使用mRNA作为模板来延伸以产生与mRNA互补的cDNA转录物922,并且还包括条形码寡核苷酸的序列区段908、912、910、916以及914中的每一者。反转录酶的末端转移酶活性可将额外碱基添加至cDNA转录物(例如,多聚胞苷酸)。转换寡核苷酸924可然后与cDNA转录物杂交并且促进模板转换。然后可经由使用转换寡核苷酸924作为模板来延伸cDNA转录物922而将与转换寡核苷酸序列互补的序列并入cDNA转录物922中。在操作966中,可使mRNA 920、cDNA转录物922以及转换寡核苷酸924变性,并且可使cDNA转录物922与用额外标签946(例如生物素)标记的捕获寡核苷酸944杂交。在此操作中,可使生物素标记过的与cDNA转录物杂交的捕获寡核苷酸944与相互作用的标签936(例如链霉亲和素)接触,所述相互作用的标签可被连接至磁性珠粒938。在使用向下拉动的操作(例如,经由磁性分离、离心)与其他物质(例如,过量条形码化寡核苷酸)分离之后,可在操作975处用引物926扩增cDNA转录物(例如,经由PCR),随后在操作977中纯化(例如,经由固相可逆固定(SPRI)),并且在操作979中进一步处理(剪切;序列928、932以及930的连接;以及后续扩增(例如,经由PCR))。在序列908为P7序列并且序列910为R2引物结合位点的一些情况下,序列930为P5序列,并且序列928为R1引物结合位点,并且序列932为i5样品索引序列。在序列908为P5序列并且序列910为R1引物结合位点的其他情况下,序列930为P7序列,并且序列928为R2引物结合位点,并且序列932为i7样品索引序列。在一些情况下,操作971和973可在分区中进行,而操作966、975、977(纯化)以及979可在主体中(例如,在分区外)进行。在分区为乳液中的微滴的情况下,可将乳液破坏并且汇集微滴的内容物以完成操作966、975、977以及979。

图9E中示出了用于RNA分析(包括细胞RNA分析)的另一示例性方法。在此方法中,将单个细胞连同带条形码的珠粒、转换寡核苷酸990以及其他试剂(诸如反转录酶、还原剂以及dNTP)一起共分配至分区(例如,乳液中的微滴)中。在操作981中,将细胞溶解,同时使条形码化寡核苷酸(例如,如图9A中所示的902)从珠粒释放(例如,经由还原剂的作用)。在一些情况下,序列908为P7序列,并且序列910为R2引物结合位点。在其他情况下,序列908为P5序列,并且序列910为R1引物结合位点。接着,所释放的条形码寡核苷酸的多聚胸苷酸区段然后与从细胞释放的mRNA 920的多聚腺苷酸尾杂交。接着,在操作983处,多聚胸苷酸区段然后在反转录反应中延伸以产生与mRNA互补的cDNA转录物922,并且还包括条形码寡核苷酸的序列区段908、912、910、916以及914中的每一者。反转录酶的末端转移酶活性可将额外碱基添加至cDNA转录物(例如,多聚胞苷酸)。转换寡核苷酸990可然后与cDNA转录物杂交并且促进模板转换。可将与转换寡核苷酸序列互补并且包括T7启动子序列的序列并入cDNA转录物922中。在操作968处,合成第二链,并且在操作970处,T7启动子序列可在体外转录中由T7聚合酶使用以产生RNA转录物。在操作985处,可将RNA转录物纯化(例如,经由固相可逆固定(SPRI)),反转录以形成DNA转录物,并且可针对DNA转录物中的每一者来合成第二链。在一些情况下,在纯化之前,可使RNA转录物与DNA酶(例如DNA酶I)接触以分解残余DNA。在操作987处,然后将DNA转录物片段化并且连接至额外功能序列,诸如序列928、932以及930,并且在一些情况下,进一步扩增(例如,经由PCR)。在序列908为P7序列并且序列910为R2引物结合位点的一些情况下,序列930为P5序列,并且序列928为R1引物结合位点,并且序列932为i5样品索引序列。在序列908为P5序列并且序列910为R1引物结合位点的一些情况下,序列930为P7序列,并且序列928为R2引物结合位点,并且序列932为i7样品索引序列。在一些情况下,在去除一部分DNA转录物之前,可使DNA转录物与RNA酶接触以分解残余RNA。在一些情况下,操作981和983可在分区中进行,而操作968、970、985以及987可在主体中(例如,在分区外)进行。在分区为乳液中的微滴的情况下,可将乳液破坏并且汇集微滴的内容物以完成操作968、970、985以及987。

图10中示出了条形码寡核苷酸用于包括信使RNA(mRNA,包括从细胞获得的mRNA)分析的RNA分析的另一实例。如图所示,使整个寡核苷酸1002通过可释放键联1006(诸如二硫接头)与珠粒1004偶接。寡核苷酸可包括用于后续处理的功能序列,诸如功能序列1008,其可包括测序仪专用流动细胞连接序列,例如P7序列;以及功能序列1010,其可包括测序引物序列,例如R2引物结合位点。用于条形码化样品RNA的结构内包括条形码序列1012。寡核苷酸结构中可包括RNA特异性(例如,mRNA特异性)引导序列,诸如多聚胸苷酸序列1014。可包括锚定序列区段(未示出)以确保多聚胸苷酸序列在mRNA的序列末端处杂交。可在寡核苷酸序列内提供额外序列区段1016。如本文中别处所描述,此额外序列可提供独特的分子序列区段。可包括额外功能序列1020以进行体外转录,例如T7 RNA聚合酶启动子序列。如应了解,虽然被示出为连接至珠粒表面的单一寡核苷酸,但单个珠粒可包括数十至成千上万或甚至数百万的单个寡核苷酸分子,其中如所提到,对于给定珠粒来说条形码区段可为恒定的或相对恒定的,但其中在单个珠粒之间可变或独特的序列区段将不同。

在细胞RNA分析的示例性方法中并且参考图10,将细胞与带条形码的珠粒以及其他试剂(诸如反转录酶、还原剂以及dNTP)一起共分配至分区(例如,乳液中的微滴)中。在操作1050中,将细胞溶解,同时使条形码化寡核苷酸1002从珠粒释放(例如,经由还原剂的作用),并且所释放的条形码寡核苷酸的多聚胸苷酸区段1014然后与mRNA 1020的多聚腺苷酸尾杂交。接着,在操作1052处,多聚胸苷酸区段然后在反转录反应中使用mRNA作用模板来延伸以产生mRNA的cDNA转录物1022,并且还包括条形码寡核苷酸的序列区段1020、1008、1012、1010、1016以及1014中的每一者。在任何给定分区内,单个mRNA分子的所有cDNA转录物将包括共同的条形码序列区段1012。然而,通过包括独特的随机N-mer序列,在给定分区内由不同mRNA分子得到的转录物在此独特序列处将不同。如本文中别处所描述,此提供甚至在给定分区的内容物的任何后续扩增之后仍可识别的定量特征,例如与共同条形码相关的独特区段的数目可指示来源于单一分区并且因此来源于单一细胞的mRNA的量。在操作1054处,合成第二链,并且在操作1056处,T7启动子序列可在体外转录中由T7聚合酶使用以产生RNA转录物。在操作1058处,将转录物片段化(例如,剪切),连接至额外功能序列,并且反转录。功能序列可包括测序仪专用流动细胞连接序列1030,例如P5序列;以及功能序列1028,其可包括测序引物,例如R1引物结合序列;以及功能序列1032,其可包括样品索引,例如i5样品索引序列。在操作1060处,可将RNA转录物反转录至DNA,DNA扩增(例如经由PCR),并且测序以识别mRNA的cDNA转录物的序列,以及对条形码区段和独特的序列区段进行测序。在一些情况下,操作1050和1052可在分区中进行,而操作1054、1056、1058以及1060可在主体中(例如,在分区外)进行。在分区为乳液中的微滴的情况下,可将乳液破坏并且汇集微滴的内容物以完成操作1054、1056、1058以及1060。

在如图10中所示用于RNA(例如细胞RNA)分析的条形码寡核苷酸的替代实例中,功能序列1008可为P5序列,并且功能序列1010可为R1引物结合位点。此外,功能序列1030可为P7序列,功能序列1028可为R2引物结合位点,并且功能序列1032可为i7样品索引序列。

图11中示出了条形码寡核苷酸用于包括信使RNA(mRNA,包括从细胞获得的mRNA)分析的RNA分析的额外实例。如图所示,使整个寡核苷酸1102通过可释放键联1106(诸如二硫接头)与珠粒1104偶接。寡核苷酸可包括用于后续处理的功能序列,诸如功能序列1108,其可包括测序仪专用流动细胞连接序列,例如P5序列;以及功能序列1110,其可包括测序引物序列,例如R1引物结合位点。在一些情况下,序列1108为P7序列,并且序列1110为R2引物结合位点。用于条形码化样品RNA的结构内包括条形码序列1112。可在寡核苷酸序列内提供额外序列区段1116。在一些情况下,如本文中别处所描述,此额外序列可提供独特的分子序列区段。可包括额外序列1114以促进模板转换,例如多聚鸟苷酸。如应了解,虽然被示出为连接至珠粒表面的单一寡核苷酸,但单个珠粒可包括数十至成千上万或甚至数百万的单个寡核苷酸分子,其中如所提到,对于给定珠粒来说条形码区段可为恒定的或相对恒定的,但其中在单个珠粒之间可变或独特的序列区段将不同。

在细胞mRNA分析的示例性方法中并且参考图11,将细胞连同带条形码的珠粒、多聚胸苷酸序列以及其他试剂(诸如反转录酶、还原剂以及dNTP)一起共分配至分区(例如,乳液中的微滴)中。在操作1150中,将细胞溶解,同时使条形码化寡核苷酸从珠粒释放(例如,经由还原剂的作用),并且多聚胸苷酸序列与从细胞释放的mRNA 1120的多聚腺苷酸尾杂交。接着,在操作1152中,然后在反转录反应中使用mRNA作为模板来延伸多聚胸苷酸序列以产生与mRNA互补的cDNA转录物1122。反转录酶的末端转移酶活性可将额外碱基添加至cDNA转录物(例如,多聚胞苷酸)。添加至cDNA转录物的额外碱基(例如多聚胞苷酸)可然后与条形码化寡核苷酸的1114杂交。此可促进模板转换,并且可将与条形码寡核苷酸互补的序列并入cDNA转录物中。可对转录物进行进一步处理(例如扩增、部分去除、额外序列添加等)并且如本文中别处所描述例如通过测序进行表征。由此类方法产生的构建体的配置可帮助最小化(或避免)在测序期间对多聚胸苷酸序列的测序。

图12A中示出了用于包括细胞RNA分析的RNA分析的条形码寡核苷酸的额外实例。如图所示,使整个寡核苷酸1202通过可释放键联1206(诸如二硫接头)与珠粒1204偶接。寡核苷酸可包括用于后续处理的功能序列,诸如功能序列1208,其可包括测序仪专用流动细胞连接序列,例如P5序列;以及功能序列1210,其可包括测序引物序列,例如R1引物结合位点。在一些情况下,序列1208为P7序列,并且序列1210为R2引物结合位点。用于条形码化样品RNA的结构内包括条形码序列1212。可在寡核苷酸序列内提供额外序列区段1216。在一些情况下,如本文中别处所描述,此额外序列可提供独特的分子序列区段。如应了解,虽然被示出为连接至珠粒表面的单一寡核苷酸,但单个珠粒可包括数十至成千上万或甚至数百万的单个寡核苷酸分子,其中如所提到,对于给定珠粒来说条形码区段可为恒定的或相对恒定的,但其中在单个珠粒之间可变或独特的序列区段将不同。在使用此条形码的细胞RNA分析的示例性方法中,将细胞连同带条形码的珠粒和其他试剂(诸如RNA连接酶和还原剂)一起共分配至分区(例如乳液中的微滴)中。将细胞溶解,同时使条形码化寡核苷酸从珠粒释放(例如,经由还原剂的作用)。然后可在分区中时通过RNA连接酶将条形码化寡核苷酸连接至mRNA转录物的5’端。后续操作可包括纯化(例如,经由固相可逆固定(SPRI))和进一步处理(剪切、功能序列的连接以及后续扩增(例如,经由PCR)),并且这些操作可在主体中(例如在分区外)进行。在分区为乳液中的微滴的情况下,可将乳液破坏并且汇集微滴的内容物以进行额外操作。

图12B中示出了用于包括细胞RNA分析的RNA分析的条形码寡核苷酸的额外实例。如图所示,使整个寡核苷酸1222通过可释放键联1226(诸如二硫接头)与珠粒1224偶接。寡核苷酸可包括用于后续处理的功能序列,诸如功能序列1228,其可包括测序仪专用流动细胞连接序列,例如P5序列;以及功能序列1230,其可包括测序引物序列,例如R1引物结合位点。在一些情况下,序列1228为P7序列,并且序列1230为R2引物结合位点。用于条形码化样品RNA的结构内包括条形码序列1232。寡核苷酸结构中还可包括引导序列1234(例如,随机引导序列),例如随机六聚体。可在寡核苷酸序列内提供额外序列区段1236。在一些情况下,如本文中别处所描述,此额外序列提供独特的分子序列区段。如应了解,虽然被示出为连接至珠粒表面的单一寡核苷酸,但单个珠粒可包括数十至成千上万或甚至数百万的单个寡核苷酸分子,其中如所提到,对于给定珠粒来说条形码区段可为恒定的或相对恒定的,但其中在单个珠粒之间可变或独特的序列区段将不同。在使用图12B的条形码寡核苷酸的细胞mRNA分析的示例性方法中,将细胞连同带条形码的珠粒和额外试剂(诸如反转录酶、还原剂以及dNTP)一起共分配至分区(例如,乳液中的微滴)中。将细胞溶解,同时使条形码化寡核苷酸从珠粒释放(例如,经由还原剂的作用)。在一些情况下,序列1228为P7序列,并且序列1230为R2引物结合位点。在其他情况下,序列1228为P5序列,并且序列1230为R1引物结合位点。随机六聚体的引导序列1234可随机杂交细胞mRNA。随机六聚体序列然后可在反转录反应中使用来自细胞的mRNA作为模板来延伸以产生与mRNA互补的cDNA转录物,并且还包括条形码寡核苷酸的序列区段1228、1232、1230、1236以及1234中的每一者。后续操作可包括纯化(例如,经由固相可逆固定(SPRI))、进一步处理(剪切、功能序列的连接以及后续扩增(例如,经由PCR)),并且这些操作可在主体中(例如在分区外)进行。在分区为乳液中的微滴的情况下,可将乳液破坏并且汇集微滴的内容物以进行额外操作。可与带条形码的珠粒一起共分配的额外试剂可包括用于阻断核糖体RNA(rRNA)的寡核苷酸以及用于消化来自细胞的基因组DNA和cDNA的核酸酶。或者,在额外处理操作期间可施加rRNA去除剂。由此类方法产生的构建体的配置可帮助最小化(或避免)在测序期间对多聚胸苷酸序列的测序。

本文所描述的单一细胞分析方法还可适用于分析全转录组。参考回到图12B的条形码,引导序列1234可为随机N-mer。在一些情况下,序列1228为P7序列,并且序列1230为R2引物结合位点。在其他情况下,序列1228为P5序列,并且序列1230为R1引物结合位点。在使用此条形码的全转录组分析的示例性方法中,将单个细胞连同带条形码的珠粒、多聚胸苷酸序列以及其他试剂(诸如反转录酶、聚合酶、还原剂以及dNTP)一起共分配至分区(例如,乳液中的微滴)中。在此方法的操作中,将细胞溶解,同时使条形码化寡核苷酸从珠粒释放(例如,经由还原剂的作用),并且多聚胸苷酸序列与细胞mRNA的多聚腺苷酸尾杂交。在使用mRNA作为模板的反转录反应,可产生细胞mRNA的cDNA转录物。然后可用RNA酶降解RNA。条形码化寡核苷酸中的引导序列1234可然后随机与cDNA转录物杂交。可类似于图3中所示使用与珠粒和细胞共分配的聚合酶和其他延伸试剂延伸寡核苷酸以产生类似于图3(图F)中所示的示例性扩增产物的扩增产物(例如,条形码化片段)。在一些情况下可对条形码化核酸片段进行进一步处理(例如,如本文中别处所描述的扩增、额外序列添加、清理过程等),例如通过序列分析表征。在此操作中,测序信号可来自全长RNA。

虽然已单个地论述了使用各种条形码设计的操作,但单个珠粒可包括供同时使用的各种设计的条形码寡核苷酸。

除了表征单个细胞或来自较大群体的细胞子群体,本文所描述的方法和系统还可用于表征单个细胞,作为一种提供对细胞或其他有机体群体的总体型态的途径。多种应用需要评估细胞群体内不同细胞或生物体类型的存在并且对其进行定量,包括例如微生物组分析和表征、环境测试、食品安全测试、流行病学分析(例如在追溯污染时)等。特定而言,可使用上文所描述的分析方法单个地表征序列和/或识别群体内的大量单个细胞。然后可使用此表征来组装起源群体的总体型态,其可提供重要的预后和诊断信息。

举例来说,人微生物组(包括例如肠、颊、表皮微生物组等)的变化已被识别为不同病状或总体健康状态的诊断和预后信息。使用本文所描述的单一细胞分析方法和系统,再次,可表征、测序和识别整个群体中的单个细胞,并且识别所述群体内的变化,所述变化可指示诊断相关因素。举例来说,细菌16S核糖体RNA基因的测序已被用作一种高度精确的细菌系统分类方法。使用上文所描述的靶向型扩增和测序方法可提供细胞群体内的单个细胞的识别。可进一步量化群体内的不同细胞的数目以识别当前状态或状态随时间的变化。参见例如Morgan等,PLoS Comput.Biol.,第12章,2012年12月,8(12):e1002808以及Ram等,Syst.Biol.Reprod.Med.,2011年6月,57(3):162-170,这些参考文献中的每一者出于所有目的以全文引用的方式并入本文中。同样地,感染或潜在感染的识别和诊断也可受益于本文所描述的单一细胞分析,例如用于识别存在于其他细胞或其他生物材料、细胞和/或核酸的较大混合物(包括上文所描述的环境以及任何其他诊断相关环境,例如脑脊髓流体、血液、粪便或肠道样品等)中的微生物种类。

前面的分析还可特别适用于通过分析给定样品中的细胞群体之间的不同抗性标记物/突变的分布和型态来表征不同细胞(例如,癌细胞、细菌病原体等)的潜在药物抗性。另外,细胞群体之间这些标记物/突变随时间的变化的表征可提供对以此类药物抗性问题为特征的多种疾病的进展、改变、预防以及治疗的有价值的深入理解。

虽然就细胞进行了描述,但应了解,此描述内涵盖多种单个生物体或生物体组分中的任一种,包括例如细胞、病毒、细胞器、细胞内含物、囊泡等。另外,在参考细胞的情况下,应了解,此类参考包括任何类型的细胞,包括但不限于原核细胞、真核细胞、细菌、真菌、植物、哺乳动物或其他动物细胞类型、支原体、正常组织细胞、肿瘤细胞或任何其他细胞类型,无论是源于单细胞还是多细胞生物体。

类似地,对不同环境样品进行分析以分析存在于此类样品内的微生物生物体、病毒或其他生物污染物可提供关于疾病流行病学的重要信息,并且潜在地辅助预测疾病暴发、传染病的流行。

如上文所描述,还可使用本文所描述的方法、系统以及组合物来分析和表征单个细胞或细胞群体的其他方面。在一种示例性方法中,提供含有要关于细胞表面蛋白进行分析和表征的细胞的样品。还提供对细胞所要被表征的细胞表面蛋白或抗原(或其他细胞特征)(本文中也称为细胞表面特征物结合基)具有结合亲和力的抗体、抗体片段或其他分子的文库。为了便于讨论,这些亲和基在本文中被称为结合基。结合基可包括指示结合基所结合的细胞表面特征物的报告分子。特定而言,对一种类型的细胞表面特征物具特异性的结合基类型将包含第一报告分子,而对不同细胞表面特征物具特异性的结合基类型将具有与其缔合的不同报告分子。在一些方面,这些报告分子将包含寡核苷酸序列。基于寡核苷酸的报告分子提供能够就序列来说产生显著多样性的优点,同时还容易地可连接至大多数生物分子,例如抗体等,并且容易地被检测,例如使用测序或阵列技术。在示例性方法中,结合基包括与其连接的寡核苷酸。因此,第一结合基类型(例如第一类型的细胞表面特征物的抗体)将缔合有具有第一核苷酸序列的报告寡核苷酸。不同的结合基类型(例如对其他不同细胞表面特征物具有结合亲和力的抗体)将缔合有包含不同核苷酸序列(例如,具有部分或完全不同的核苷酸序列)的报告寡核苷酸。在一些情况下,对于各种类型的细胞表面特征物结合基(例如,抗体或抗体片段),报告寡核苷酸序列可为已知并且容易可识别为与已知细胞表面特征物结合基缔合。这些寡核苷酸可直接与结合基偶接,或它们可被连接至珠粒、分子晶格(例如线性、球形、交联或其他聚合物)或与结合基连接或以其他方式缔合的其他框架,此允许多个报告寡核苷酸连接至单一结合基。

在多个报告分子与单一结合基偶接的情况下,此类报告分子可包含相同的序列,或特定结合基将包括已知的报告寡核苷酸序列集合。在例如对不同细胞表面特征物具特异性的不同结合基之间,报告分子可为不同的并且可归属于特定结合基。

报告基团连接至结合基可通过多种直接或间接、共价或非共价缔合或连接中的任一种来实现。举例来说,在寡核苷酸报告基团与基于抗体的结合基缔合的情况下,可使用化学缀合技术(例如可从Innova Biosciences获得的

视所需报告分子的多样性或给定分析、所采用的序列检测方案等而定,可提供具有一系列不同长度中的任一种的报告寡核苷酸。在一些情况下,这些报告序列的长度可大于约5个核苷酸,长度大于约10个核苷酸,长度大于约20、30、40、50、60、70、80、90、100、120、150或甚至200个核苷酸。在一些情况下,这些报告核苷酸的长度可小于约250个核苷酸,长度小于约200、180、150、120、100、90、80、70、60、50、40或甚至30个核苷酸。在许多情况下,可对报告寡核苷酸加以选择以提供条形码化产物,所述条形码化产物已经调节尺寸并且以其他方式配置成在测序系统上进行分析。举例来说,可以理想地形成具有为特定测序系统所需的长度的可测序产物的长度提供这些序列。同样地,这些报告寡核苷酸除了报告序列还可包括额外序列元件,诸如测序仪连接序列、测序引物序列、扩增引物序列或这些序列中的任一种的互补序列。

在操作中,将含细胞样品与针对希望分析的细胞表面特征物中的任一种的结合分子和其相关报告寡核苷酸一起孵育。在孵育之后,洗涤细胞以去除未结合的结合基。在洗涤之后,将细胞与上文所描述的条形码承载珠粒一起分配至单独分区(例如,微滴)中,其中各分区包括有限数目的细胞,例如(在一些情况下)单一细胞。在条形码从珠粒释放后,它们将引导报告寡核苷酸的扩增和条形码化。如上文所提到,报告分子的条形码化重复可另外包括功能序列,诸如引物序列、连接序列等。

然后对条形码化报告寡核苷酸进行序列分析以识别哪些报告寡核苷酸结合于分区内的细胞。此外,通过也对相关条形码序列进行测序,可识别给定细胞表面特征物可能来自于与其它不同细胞表面特征物相同的细胞,其报告序列包括相同的条形码序列,即它们是源于相同的分区。

基于出自于单个分区(基于条形码序列的存在)的报告分子,然后可形成来自细胞群体的单个细胞的细胞表面形态。可将单个细胞或细胞群体的型态与其他细胞(例如‘正常’细胞)的型态相比较,以识别细胞表面特征物的变异,此可提供诊断相关信息。特定而言,这些型态可特别适用于诊断以细胞表面受体的变异为特征的多种病症,诸如癌症和其他病症。

IV.装置和系统

本文还提供用于如上文所描述分配细胞的微流体装置。此类微流体装置可包括用于进行分配过程(如图1和2中所陈述的那些)的通道网络。特别适用的微流体装置的实例描述于2014年4月4日提交并且出于所有目的以全文引用的方式并入本文中的美国临时专利申请号61/977,804中。简要地说,这些微流体装置可包括用于将细胞分配至单独分区中并且将此类细胞与例如设置于珠粒上的寡核苷酸条形码文库成员共分配的通道网络(诸如本文所描述的那些)。可将这些通道网络设置于固体主体(例如其中限定所述通道的玻璃、半导体或聚合物主体结构)内,其中那些通道在其末端与用于接收各种输入流体以及用于从通道网络的输出最终沉淀所分配的细胞等的储集器连通。举例来说,并且参考图2,可为流体偶接至通道202的储集器提供细胞214的水性悬浮液,同时可为偶接至通道204的储集器提供承载寡核苷酸的珠粒216的水性悬浮液。可为通道区段206和208提供非水性溶液(例如油),在通道接头212处将水性流体以微滴形式分配至所述非水性溶液中。最后,可将出口储集器流体偶接至通道210,可将所分配的细胞和珠粒递送至所述通道中以及从其中收获它们。如应了解,虽然以储集器形式进行了描述,但应了解,可将通道区段偶接至多种不同流体来源或接收组件(包括管道、歧管)或其他系统的流体组件中的任一种。

还提供通过通道网络例如通过所施加的压力差、离心力、电动泵送、毛细管或重力流等来控制这些流体的流动的系统。

V.试剂盒

本文还提供用于分析单个细胞或小细胞群体的试剂盒。试剂盒可包括一种、两种、三种、四种、五种或更多种直至所有的分配流体,包括水性缓冲液与非水性分配流体或油;如本文所描述可释放地与珠粒缔合的核酸条形码文库;微流体装置;用于破坏细胞扩增核酸并且在细胞核酸的片段或其复制物上提供额外功能序列的试剂;以及关于在本文所描述的方法中使用前述各项中的任一种的说明。

VI.计算机控制系统

本公开提供计算机控制系统,其被编程以实现本公开的方法。图17示出了计算机系统1701,其被编程或以其他方式配置成实现本公开的方法,包括核酸测序方法、核酸测序数据的解释和细胞核酸(例如诸如RNA,mRNA)的分析以及由测序数据得到的对细胞的表征。计算机系统1701可为用户的电子装置或相对于电子装置远程定位的计算机系统。电子装置可为移动电子装置。

计算机系统1701包括中央处理单元(CPU,在本文中也为“处理器”和“计算机处理器”)1705,其可为单核或多核处理器,或用于平行处理的多个处理器。计算机系统1701还包括存储器或存储位置1710(例如随机存取存储器、只读存储器、闪速存储器)、电子存储单元1715(例如硬盘)、用于与一个或多个其他系统通信的通信接口1720(例如网络适配器)以及外围装置1725,诸如缓存、其他存储器、数据存储和/或电子显示适配器。存储器1710、存储单元1715、接口1720以及外围装置1725通过通信总线(实线)(诸如母板)与CPU 1705通信。存储单元1715可为用于存储数据的数据存储单元(或数据存储库)。计算机系统1701可在通信接口1720的辅助下可操作地耦合至计算机网络(“网络”)1730。网络1730可为因特网、因特网以及/或者外联网,或者与因特网通信的内联网和/或外联网。网络1730在一些情况下为电信和/或数据网络。网络1730可包括一个或多个计算机服务器,所述一个或多个计算机服务器可实现分布式计算,诸如云计算。网络1730在一些情况下在计算机系统1701的辅助下,可实现对等网络,所述对等网络可使得耦合至计算机系统1701的装置能够起客户端或服务器的作用。

CPU 1705可执行机器可读指令的序列,所述机器可读指令的序列可在程序或软件中实现。指令可存储在存储位置(诸如存储器1710)中。可将指令引导至CPU 1705,所述CPU可随后编程或以其他方式配置CPU1705以实现本公开的方法。由CPU 1705进行的操作的实例可包括取指令、解码、执行以及写回。

CPU 1705可为电路(诸如集成电路)的一部分。电路中可包括系统1701的一个或多个其他组件。在一些情况下,电路为应用程序专用集成电路(ASIC)。

存储单元1715可存储文件,诸如驱动器、文库以及保存的程序。存储单元1715可存储用户数据,例如用户偏好和用户程序。计算机系统1701在一些情况下可包括一个或多个额外数据存储单元,所述一个或多个额外数据存储单元在计算机系统1701的外部,诸如位于通过内联网或因特网与计算机系统1701通信的远程服务器上。

计算机系统1701可通过网络1730与一个或多个远程计算机系统通信。举例来说,计算机系统1701可与用户的远程计算机系统通信。远程计算机系统的实例包括个人计算机(例如便携式PC)、板型或平板PC(例如

可通过存储于计算机系统1701的电子存储位置上(诸如在存储器1710或电子存储单元1715上)的机器(例如,计算机处理器)可执行的代码来实现如本文所描述的方法。可以软件的形式提供机器可执行或机器可读代码。在使用期间,可由处理器1705执行代码。在一些情况下,可从存储单元1715检索代码并且存储于存储器1710上,以备由处理器1705存取。在一些情况下,可排除电子存储单元1715,并且将机器可执行指令存储于存储器1710上。

代码可被预编译并且被配置成与具有适合执行代码的处理器的机器一起使用,或在运行期间被编译。可在编程语言中提供代码,可对所述编程语言加以选择以使得代码能够以预编译或当时编译(as-compiled)方式执行。

可在编程中实现本文所提供的诸如计算机系统1701的系统和方法的多个方面。技术的各个方面可被认为是典型地呈在一种类型的机器可读介质上执行或在一种类型的机器可读介质中实现的机器(或处理器)可执行代码和/或相关数据形式的“产品”或“制品”。机器可执行代码可存储于电子存储单元,诸如存储器(例如只读存储器、随机存取存储器、闪速存储器)或硬盘中。“存储”类型介质可包括计算机、处理器等的任何或所有的有形存储器,或其相关模块,诸如各种半导体存储器、磁带驱动器、磁盘驱动器等,其可在软件编程的任何时间提供非暂时存储。软件的全部或部分有时可通过因特网或各种其他电信网络进行通信。此类通信例如可实现软件从一个计算机或处理器加载至另一者中,例如从管理服务器或主机计算机至应用程序服务器的计算机平台中。因此,可承载软件元素的另一类型的介质包括诸如通过有线和光学陆上线路网络并经各种空中链路跨越本地装置之间的物理接口使用的光波、电波以及电磁波。携带此类波的物理元素(诸如有线或无线链路、光学链路等)也可被视为承载软件的介质。如本文中所用,除非限于非暂时有形“存储”介质,否则诸如计算机或机器“可读介质”等术语是指参与提供指令至处理器以执行的任何介质。

因此,机器可读介质(诸如计算机可执行代码)可采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,诸如图式中所示的任何计算机中诸如可用于实现数据库等的任何存储装置等。易失性存储介质包括动态存储器,诸如此类计算机平台的主存储器。有形传输介质包括同轴线缆;铜线以及光纤,包括包含计算机系统内的总线的线。载波传输介质可采取电或电磁信号或声波或光波形式,诸如在射频(RF)和红外线(IR)数据通信期间产生的那些。因此,计算机可读介质的常见形式包括例如:软磁盘、软盘、硬盘、磁带、任何其他磁性介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、打孔卡纸带、具有孔模式的任何其他物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储芯片或盒、传送数据或指令的载波、传送此类载波的线缆或链路或计算机可从中读取编程代码和/或数据的任何其他介质。这些形式的计算机可读介质中许多可参与将一个或多个指令的一个或多个序列运送至处理器以执行。

计算机系统1701可包括电子显示器1735或与其通信,所述电子显示器可包括用于提供例如核酸测序、核酸测序数据分析、核酸测序样品表征、细胞表征等的结果的用户界面(UI)1740。UI的实例包括但不限于图形用户界面(GUI)和基于网络的用户界面。

本公开的方法和系统可通过一种或多种算法来实现。可在由中央处理单元1705执行后通过软件来实现算法。算法可例如引发核酸测序,处理核酸测序数据,解释核酸测序结果,表征核酸样品,表征细胞等。

本发明提供了包括但不限于以下实施方案:

1.一种分析来自细胞的核酸的方法,其包括:

(a)将源于单个细胞的核酸提供至离散分区中;

(b)产生源于所述离散分区内的所述核酸的一个或多个第一核酸序列,所述一个或多个第一核酸序列已连接于包含共同核酸条形码序列的寡核苷酸;

(c)产生对所述一个或多个第一核酸序列或源于所述一个或多个第一核酸序列的一个或多个第二核酸序列的表征,所述一个或多个第二核酸序列包含所述共同条形码序列;以及

(d)至少部分基于在(c)中所产生的所述表征中存在所述共同核酸条形码序列将所述一个或多个第一核酸序列或一个或多个第二核酸序列识别为源于所述单个细胞。

2.如实施方案1所述的方法,其中所述离散分区为离散微滴。

3.如实施方案1所述的方法,其中,在(a)中,将所述寡核苷酸与源于所述单个细胞的所述核酸共分配至所述离散分区中。

4.如实施方案3所述的方法,其中,在(a)中,将所述寡核苷酸中的至少10,000个与源于所述单个细胞的所述核酸共分配至所述离散分区中。

5.如实施方案4所述的方法,其中,在(a)中,将所述寡核苷酸中的至少100,000个与源于所述单个细胞的所述核酸共分配至所述离散分区中。

6.如实施方案5所述的方法,其中,在(a)中,将所述寡核苷酸中的至少500,000个与源于所述单个细胞的所述核酸共分配至所述离散分区中。

7.如实施方案1所述的方法,其中,在(a)中,提供连接至珠粒的所述寡核苷酸,其中珠粒上的各寡核苷酸包含相同的条形码序列,并且将所述珠粒与所述单个细胞共分配至所述离散分区中。

8.如实施方案7所述的方法,其中所述寡核苷酸可释放地连接至所述珠粒。

9.如实施方案8所述的方法,其中所述珠粒包括可降解珠粒。

10.如实施方案9所述的方法,其进一步包括在(b)之前或期间,经由降解所述珠粒使所述寡核苷酸从所述珠粒释放。

11.如实施方案1所述的方法,其进一步包含括在(c)之前,使所述一个或多个第一核酸序列从所述离散分区释放。

12.如实施方案1所述的方法,其中(c)包括对所述一个或多个第一核酸序列或所述一个或多个第二核酸序列进行测序。

13.如实施方案12所述的方法,其进一步包括由所述一个或多个第一核酸序列或所述一个或多个第二核酸序列的序列组装所述单个细胞的基因组的至少一部分的连续核酸序列。

14.如实施方案13所述的方法,其中基于所述单个细胞的所述基因组的至少一部分的所述核酸序列来表征所述单个细胞。

15.如实施方案1所述的方法,其中所述核酸从所述离散分区中的所述单个细胞释放。

16.如实施方案1所述的方法,其中所述核酸包括核糖核酸(RNA)。

17.如实施方案16所述的方法,其中所述RNA为信使RNA(mRNA)。

18.如实施方案16所述的方法,其中(b)进一步包括在产生所述一个或多个第一核酸序列的条件下使所述核酸进行反转录。

19.如实施方案18所述的方法,其中所述反转录在所述离散分区中进行。

20.如实施方案18所述的方法,其中所述寡核苷酸被提供于所述离散分区中并且进一步包含多聚胸苷酸序列。

21.如实施方案20所述的方法,其中所述反转录包括使所述多聚胸苷酸序列与所述核酸中的每一者的至少一部分杂交并且以模板定向的方式延伸所述多聚胸苷酸序列。

22.如实施方案21所述的方法,其中所述寡核苷酸进一步包含促进所述多聚胸苷酸序列的杂交的锚定序列。

23.如实施方案20所述的方法,其中所述寡核苷酸进一步包含随机引导序列。

24.如实施方案23所述的方法,其中所述随机引导序列为随机六聚体。

25.如实施方案24所述的方法,其中所述反转录包括使所述随机引导序列与所述核酸中的每一者的至少一部分杂交并且以模板定向的方式延伸所述随机引导序列。

26.如实施方案1所述的方法,其中所述一个或多个第一核酸序列中的给定者与所述核酸中的给定者的至少一部分具有序列互补性。

27.如实施方案1所述的方法,其中所述离散分区至多包括多个细胞之中的所述单个细胞。

28.如实施方案1所述的方法,其中所述寡核苷酸进一步包含独特的分子序列区段。

29.如实施方案28所述的方法,其进一步包括至少部分基于所述独特的分子序列区段的存在将所述一个或多个第一核酸序列或所述一个或多个第二核酸序列的单个核酸序列识别为源于所述核酸中的给定核酸。

30.如实施方案29所述的方法,其进一步包括基于所述独特的分子序列区段的存在测定所述给定核酸的量。

31.如实施方案1所述的方法,其进一步包括在(c)之前,将一个或多个额外序列添加至所述一个或多个第一核酸序列以产生所述一个或多个第二核酸序列。

32.如实施方案31所述的方法,其进一步包括在转换寡核苷酸的辅助下将第一额外核酸序列添加至所述一个或多个第一核酸序列。

33.如实施方案32所述的方法,其中所述转换寡核苷酸与所述一个或多个第一核酸序列的至少一部分杂交并且以模板定向的方式进行延伸以使所述第一额外核酸序列与所述一个或多个第一核酸序列偶接。

34.如实施方案33所述的方法,其进一步包括扩增与所述第一额外核酸序列偶接的所述一个或多个第一核酸序列。

35.如实施方案34所述的方法,其中所述扩增在所述离散分区中进行。

36.如实施方案34所述的方法,其中所述扩增在使与所述第一额外核酸序列偶接的所述一个或多个第一核酸序列从所述离散分区释放之后进行。

37.如实施方案34所述的方法,其进一步包括在所述扩增之后,将一个或多个第二额外核酸序列添加至与所述第一额外序列偶接的所述一个或多个第一核酸序列,以产生所述一个或多个第二核酸序列。

38.如实施方案37所述的方法,其中所述添加所述一个或多个第二额外序列包括去除与所述第一额外核酸序列偶接的所述一个或多个第一核酸序列中的每一者的一部分以及使其与所述一个或多个第二额外核酸序列偶接。

39.如实施方案38所述的方法,其中所述去除经由对与所述第一额外核酸序列偶接的所述一个或多个第一核酸序列进行剪切来完成。

40.如实施方案39所述的方法,其中所述偶接经由连接来完成。

41.如实施方案18所述的方法,其进一步包括在(c)之前,使所述一个或多个第一核酸序列进行转录以产生一个或多个RNA片段。

42.如实施方案41所述的方法,其中所述转录在使所述一个或多个第一核酸序列从所述离散分区释放之后进行。

43.如实施方案41所述的方法,其中所述寡核苷酸进一步包含T7启动子序列。

44.如实施方案43所述的方法,其进一步包括在(c)之前,去除所述一个或多个RNA序列中的每一者的一部分并且使额外序列与所述一个或多个RNA序列偶接。

45.如实施方案44所述的方法,其进一步包括在(c)之前,使与所述额外序列偶接的所述一个或多个RNA序列进行反转录以产生所述一个或多个第二核酸序列。

46.如实施方案45所述的方法,其进一步包括在(c)之前,扩增所述一个或多个第二核酸序列。

47.如实施方案41所述的方法,其进一步包括在(c)之前,使所述一个或多个RNA序列进行反转录以产生一个或多个DNA序列。

48.如实施方案47所述的方法,其进一步包括在(c)之前,去除所述一个或多个DNA序列中的每一者的一部分以及使一个或多个额外序列与所述一个或多个DNA序列偶接以产生所述一个或多个第二核酸序列。

49.如实施方案48所述的方法,其进一步包括在(c)之前,扩增所述一个或多个第二核酸序列。

50.如实施方案1所述的方法,其中所述核酸包括由所述单个细胞的RNA的反转录产生的互补(cDNA)。

51.如实施方案50所述的方法,其中所述寡核苷酸进一步包含引导序列并且被提供于所述离散分区中。

52.如实施方案51所述的方法,其中所述引导序列包括随机N-mer。

53.如实施方案51所述的方法,其中(b)包括使所述引导序列与所述cDNA杂交以及以模板定向的方式延伸所述引导序列。

54.如实施方案1所述的方法,其中所述离散分区包含含有所述寡核苷酸的互补序列的转换寡核苷酸。

55.如实施方案54所述的方法,其中(b)包括使所述转换寡核苷酸与源于所述核酸的核酸片段的至少一部分杂交并且以模板定向的方式延伸所述转换寡核苷酸。

56.如实施方案1所述的方法,其中(b)包括将所述寡核苷酸连接至所述一个或多个第一核酸序列。

57.如实施方案1所述的方法,其中所述一个或多个第一核酸序列为源于所述核酸的核酸片段。

58.如实施方案1所述的方法,其中所述(b)包括使所述寡核苷酸与所述核酸偶接。

59.如实施方案58所述的方法,其中所述偶接包括连接。

60.如实施方案1所述的方法,其中多个分区包括所述离散分区。

61.如实施方案60所述的方法,其中所述多个分区平均包含每个分区少于一个细胞。

62.如实施方案60所述的方法,其中所述多个分区中少于25%的分区不包含细胞。

63.如实施方案60所述的方法,其中所述多个分区包括各自具有至少一个分配的细胞的离散分区。

64.如实施方案63所述的方法,其中少于25%的所述离散分区包含超过一个细胞。

65.如实施方案64所述的方法,其中至少所述离散分区的子集包含珠粒。

66.如实施方案65所述的方法,其中至少75%的所述离散分区包含至少一个细胞和至少一个珠粒。

67.如实施方案63所述的方法,其中所述离散分区进一步包含分配的核酸条形码序列。

68.如实施方案67所述的方法,其中所述离散分区包含至少1,000个不同的分配的核酸条形码序列。

69.如实施方案68所述的方法,其中所述离散分区包含至少10,000个不同的分配的核酸条形码序列。

70.如实施方案69所述的方法,其中所述离散分区包含至少100,000个不同的分配的核酸条形码序列。

71.如实施方案60所述的方法,其中所述多个分区包括至少1,000个分区。

72.如实施方案71所述的方法,其中所述多个分区包括至少10,000个分区。

73.如实施方案72所述的方法,其中所述多个分区包括至少100,000个分区。

74.一种表征多种不同细胞类型的群体中的细胞的方法,其包括:

(a)将来自所述群体中的单个细胞的核酸提供至离散分区中;

(b)将包含共同核酸条形码序列的寡核苷酸连接至所述离散分区内的所述单个细胞的所述核酸的一个或多个片段,其中多个不同分区包含不同的共同核酸条形码序列;

(c)表征来自所述多个离散分区的所述核酸的所述一个或多个片段,并且至少部分基于共同条形码序列的存在将所述一个或多个片段归属于单个细胞;以及

(d)基于对所述多个离散分区中的所述一个或多个片段的所述表征来表征所述群体中的多个单个细胞。

75.如实施方案74所述的方法,其进一步包括将所述核酸片段化。

76.如实施方案74所述的方法,其中所述离散分区为微滴。

77.如实施方案74所述的方法,其中所述表征所述核酸的所述一个或多个片段包括对所述单个细胞的核糖体脱氧核糖核酸进行测序,并且所述表征所述细胞包括识别细胞属、种、株或变体。

78.如实施方案77所述的方法,其中所述单个细胞源于微生物组样品。

79.如实施方案74所述的方法,其中所述单个细胞源于人组织样品。

80.如实施方案74所述的方法,其中所述单个细胞源于哺乳动物中的循环细胞。

81.如实施方案74所述的方法,其中所述单个细胞源于法医样品。

82.如实施方案74所述的方法,其中所述核酸从所述离散分区中的所述单个细胞释放。

83.一种表征单个细胞或细胞群体的方法,其包括:

(a)在允许一个或多个细胞表面特征物结合基与其各自的细胞表面特征物(若存在)之间结合的条件下,将细胞与多种不同的细胞表面特征物结合基类型一起孵育,其中各种不同的细胞表面结合基类型能够结合于不同的细胞表面特征物,并且其中各种不同的细胞表面结合基类型包含与其缔合的报告寡核苷酸;

(b)将所述细胞分配至包含含有条形码序列的多个寡核苷酸的分区中;

(c)将所述条形码序列连接至存在于所述分区中的寡核苷酸报告基;

(d)对所述寡核苷酸报告基和连接的条形码进行测序;以及

(e)基于测序的报告寡核苷酸来表征存在于所述细胞上的细胞表面特征物。

84.一种组合物,其包含多个分区,所述多个分区中的每一者包含(i)单个细胞,以及(ii)包含共同核酸条形码序列的寡核苷酸群体。

85.如实施方案84所述的组合物,其中所述多个分区包括乳液中的微滴。

86.如实施方案84所述的组合物,其中在所述多个分区中的每一者内的所述寡核苷酸群体与设置于所述多个分区中的每一者内的珠粒偶接。

87.如实施方案84所述的组合物,其中所述单个细胞已与同各自的细胞表面特征物缔合的多种不同的细胞表面特征物结合基缔合,各种不同类型的细胞表面特征物结合基包含含有不同核苷酸序列的寡核苷酸报告基。

88.如实施方案87所述的组合物,其中所述多个不同的细胞表面特征物结合基包括对多个不同的细胞表面特征物具有结合亲和力的多个不同抗体或抗体片段。

VII.实施例

实施例I使用乳液的细胞RNA分析

在一个实施例中,以如图9A中所示的操作在乳液微滴中进行使用模板转换的反转录和cDNA扩增(经由PCR)。被分配以进行反转录和cDNA扩增(经由PCR)的反应混合物包含1,000个细胞或10,000个细胞或10ng RNA、带条形码化寡核苷酸的珠粒/0.2%Tx-100/5xKapa缓冲液、2x Kapa HS HiFi预拌物(Ready Mix)、4μM转换寡核苷酸以及Smartscribe。在存在细胞的情况下,对混合物进行分配使得多数或所有的微滴包含单一细胞和单一珠粒。如操作950中将细胞溶解,同时使条形码化寡核苷酸从珠粒释放,并且所述条形码化寡核苷酸的多聚胸苷酸区段与从细胞释放的mRNA的多聚腺苷酸尾杂交。如操作952中在反转录反应中延伸多聚胸苷酸区段,并且如操作954中扩增cDNA转录物。热循环条件为42℃持续130分钟;98℃持续2min;并且以下条件的35个循环:98℃持续15sec,60℃持续20sec,以及72℃持续6min。在热循环之后,将乳液破坏并且如操作956中用戴诺珠粒(Dynabead)和0.6xSPRI纯化转录物。

图13A(对于1,000个细胞)和图13C(对于10,000个细胞)以及图13B(对于10ngRNA)(Smartscribe线)示出了乳液中的模板转换反转录和PCR的产量。如操作958中将来自在乳液中针对10ng RNA进行的RT和PCR的cDNA转录物剪切并且连接至功能序列,用0.8xSPRI清理并且通过PCR进一步扩增。用0.8x SPRI清理扩增产物。图13B(SSII线)示出了此处理的产量。

实施例II使用乳液的细胞RNA分析

在另一实施例中,以如图9A中所示的操作在乳液微滴中进行使用模板转换的反转录和cDNA扩增(经由PCR)。被分配以进行反转录和cDNA扩增(经由PCR)的反应混合物包含Jurkat细胞、带条形码化寡核苷酸的珠粒/0.2%TritonX-100/5x Kapa缓冲液、2x Kapa HSHiFi预拌物、4μM转换寡核苷酸以及Smartscribe。对混合物进行分配使得多数或所有的微滴包含单一细胞和单一珠粒。如操作950中将细胞溶解,同时使条形码化寡核苷酸从珠粒释放,并且所述条形码化寡核苷酸的多聚胸苷酸区段与从细胞释放的mRNA的多聚腺苷酸尾杂交。如操作952中在反转录反应中延伸多聚胸苷酸区段,并且如操作954中扩增cDNA转录物。热循环条件为42℃持续130分钟;98℃持续2min;并且以下条件的35个循环:98℃持续15sec,60℃持续20sec,以及72℃持续6min。在热循环之后,将乳液破坏并且如操作956中用戴诺珠粒和0.6x SPRI清理转录物。图14A中示出了在不同细胞数目(625个细胞、1,250个细胞、2,500个细胞、5,000个细胞以及10,000个细胞)情况下的反应的产量。用图14B中所示的GADPH qPCR分析结果确认这些产量。

实施例III使用乳液的RNA分析

在另一实施例中,以类似于如图9C中所示的方式在乳液微滴中进行反转录并且在主体中进行cDNA扩增。被分配以进行反转录的反应混合物包括带条形码化寡核苷酸的珠粒、10ng Jurkat RNA(例如Jurkat mRNA)、5x第一链缓冲液以及Smartscribe。如操作961中使条形码化寡核苷酸从珠粒释放,并且条形码化寡核苷酸的多聚胸苷酸区段与RNA的多聚腺苷酸尾杂交。如操作963中在反转录反应中延伸多聚胸苷酸区段。用于反转录的热循环条件为一个循环在42℃下持续2小时,而另一个循环在70℃下持续10min。在热循环之后,将乳液破坏并且如操作962中使RNA和cDNA转录物变性。然后如操作964中通过用具有生物素标签的引物进行引物延伸来合成第二链。此引物延伸的反应条件包括cDNA转录物作为第一链,并且生物素化延伸引物的浓度从0.5μM变化至3.0μM。热循环条件为一个循环在98℃下持续3min,而另一个循环为98℃持续15sec,60℃持续20sec以及72℃持续30min。在引物延伸之后,用戴诺珠粒MyOne链霉亲和素C1和T1将第二链向下拉动,并且用AgilentSureSelect XT缓冲液清理。在以下循环条件下如操作965中经由PCR预扩增第二链:一个循环在98℃下持续3min,而另一个循环为98℃持续15sec,60℃持续20sec以及72℃持续30min。图15中示出了关于各种浓度的生物素化引物(0.5μM、1.0μM、2.0μM以及3.0μM)的产量。

实施例IV使用乳液的RNA分析

在另一实例中,如图10中所示使用通过T7聚合酶体外转录来产生RNA转录物。被分配以进行反转录的混合物包含带有还包括T7 RNA聚合酶启动子序列的条形码化寡核苷酸的珠粒、10ng人RNA(例如,人mRNA)、5x第一链缓冲液以及Smartscribe。对混合物进行分配使得多数或所有的微滴包含单一珠粒。如操作1050中使条形码化寡核苷酸从珠粒释放,并且条形码化寡核苷酸的多聚胸苷酸区段与RNA的多聚腺苷酸尾杂交。如操作1052中在反转录反应中延伸多聚胸苷酸区段。热循环条件为一个循环在42℃下持续2小时,而另一个循环在70℃下持续10min。在热循环之后,将乳液破坏并且在主体中进行其余操作。然后如操作1054中通过引物延伸来合成第二链。此引物延伸的反应条件包括cDNA转录物作为模板和延伸引物。热循环条件为一个循环在98℃下持续3min,而另一个循环为98℃持续15sec,60℃持续20sec以及72℃持续30min。在此引物延伸之后,将第二链用0.6x SPRI纯化。如操作1056中,然后进行体外转录以产生RNA转录物。使体外转录进行过夜,并且将转录物用0.6xSPRI纯化。图16中示出了体外转录的RNA产量。

虽然本文中已示出和描述了本发明的一些实施方案,但对本领域技术人员来说将显而易见的是此类实施方案仅仅是通过举例而提供。本发明不旨在受说明书内所提供的特定实施例限制。虽然已参照上述说明书描述了本发明,但本文中对实施方案的描述和说明并不意在以限制意义来解释。本领域技术人员将会想到许多变化、改变以及替换,而不会脱离本发明。此外,应了解,本发明的所有方面不限于本文所阐述的特定描述、配置或相对比例,其取决于多种条件和变量。应了解,在实践本发明时可采用本文中所描述的本发明实施方案的各种替代方案。因此可以预期的是,本发明也应涵盖任何这样的替代、修改、变化或等效物。以下权利要求旨在限定本发明的范围并且从而涵盖这些权利要求和其等效物的范围内的方法和结构。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号