首页> 中国专利> 对与主要组织相容性复合体结合的肽进行单分子测序

对与主要组织相容性复合体结合的肽进行单分子测序

摘要

本公开提供鉴定并定量由主要组织相容性复合体(MHC)展示的肽的方法。此类方法可包括确定每种由MHC展示的肽的类型、识别信息和数量的能力。在一些实施例中,这些方法可用于发展抗癌疗法或测定患者HLA的类型。本文还提供包含来自所述MHC的肽的组合物,所述肽已经过制备以进行测序。

著录项

说明书

本申请要求2018年8月14日提交的美国临时专利申请号62/718,566的优先权权益,其全部内容通过引用合并于此。

本发明是在美国国立卫生研究院授予的第R35 GM122480号和第OD009572号政府拨款的支持下完成的。政府对这项发明享有一定的权利。

技术领域

本公开一般涉及蛋白质、肽测序和肽鉴定领域。更具体地,本公开涉及肽的测序用于确定与主要组织相容性复合体(MHC)结合的肽的识别信息、数量和/或序列。

背景技术

主要组织相容性复合体(MHC)是一种细胞表面蛋白复合体,对于适应性免疫系统而言至关重要。在人类中,这些也称为HLA或人类白细胞抗原。MHC的主要功能是展示源自病原体的抗原肽或通过采样经降解的细胞蛋白质以供适宜的T细胞识别。三个类别的MHC基因家族中,I类和II类被广泛研究。MHC-I家族存在于大多数有核细胞中,并展示源自细胞蛋白质组并且被CD8 T细胞上的受体识别的抗原肽。然而,MHC-II家族的蛋白质通常表达在抗原呈递细胞诸如树突细胞、巨噬细胞和B细胞中。MHC-II肽源自抗原及感染(诸如细菌感染)的免疫原性处理,并且展示给T辅助细胞和CD4 T细胞上的受体,用于发展免疫性或抗原性清除(Neefjes等人,2011)。

在人类中,存在高度多态性且共显性表达的HLA-A、HLA-B和HLA-C,它们各自可编码MHC-I蛋白复合体,在给定细胞中给出MHC-I蛋白复合体的6种不同变体。再者,等位基因形式的各HLA基因表现出肽结合亲和性方面的差异,因此,所展示的抗原肽群体(来自蛋白质组的经降解蛋白质)在序列方面差异很大。可以将由细胞MHC-I蛋白展示的肽的识别信息想象为免疫系统的信号,描述细胞蛋白质组的状态。如果作为病毒感染或恶性肿瘤的结果而产生新蛋白,则MHC-I蛋白上的新抗原肽(新抗原)是T细胞介导的免疫性的靶标。对于发现新抗原和开发癌症疫苗新抗原或内源性T细胞疗法的靶标,获得由恶性肿瘤细胞中的MHC-I展示的全部单独肽分子的序列十分重要(Yee等人,2015;Dudley和Rosenberg,2003)。

获得肿瘤活检切片中的这一信息颇具挑战性,这是因为当前技术在处理以下项中的局限性:(a)肽源的高度多样性和随机性:MHC肽源是来自蛋白质组的经降解肽,它们被ER蛋白质随机选择、处理并装载到MHC蛋白复合体上。据估计,在蛋白质组每秒钟生成的2百万种肽中,呈递150种MHC肽。除了细胞蛋白质的这一大规模亚采样之外,该肽也从错误折叠的蛋白质(缺陷性核糖体产物)生成,富含高周转蛋白质,并且HLA锚残基结合选择性也得到加强(Godkin等人,2001)。(b)HLA等位基因变异:HLA等位基因的多样性及其在细胞内的共显性表达意味着存在多个确定所展示的肽的识别信息的HLA模式。(c)低拷贝数的MHC蛋白:据估计,在单独细胞中呈递10

通过质谱直接鉴定或基于基础基因组信息的间接预测是用于鉴定MHC-I肽的两种方法。然而,这些方法不能满足将肿瘤细胞中由MHC-I蛋白质呈递的各种肽序列进行分类。灵敏度和动态范围有限的质谱偶联难以获得大量的肿瘤样品和大数据库检索空间,意味着基于质谱的方法在以高保真度鉴定丰富且均匀表达的肽序列方面的能力有限(Yadav等人,2014;Brown等人,2014)。通常包含肿瘤相关抗原或肿瘤特异性抗原的低丰度物质很少(如果被检出过)被检出。另一方面,预测肽序列的间接方法使用基础基因组信息,诸如外显子序列、转录物丰度和已知的体外测定来测量每个HLA等位基因的结合效率。但是最近,由于一些经预测的肽被发现具有免疫原性应答,所得序列表的有效性受到质疑(Vitiello和Zanetti,2017)。直接测序和鉴定这些肽分子的更灵敏的方法对于分类相关抗原肽具有重要意义,并且为个性化癌症免疫疗法铺平道路(Yee和Lizee,2017)。因此,仍非常需要开发对MHC和MHC上呈递的肽进行测序的新方法。

发明内容

在一些方面,本公开提供鉴定一种或多种由主要组织相容性复合体(MHC)展示的肽的方法。在一些实施例中,该方法包括:

(A)获得含有由MHC展示的肽的样品;

(B)用第一标记物标记由MHC展示的肽上的第一氨基酸残基以获得经标记的肽;

(C)对经标记的肽进行测序以确定一种或多种由MHC展示的肽的识别信息。

在一些实施例中,少于100,000种肽经鉴定。在一些实施例中,鉴定了每一种由MHC呈递的肽。在一些实施例中,由MHC展示的肽是从患者获得的。在一些实施例中,患者为哺乳动物诸如人类。

在一些实施例中,该方法包括鉴定2种、3种、4种、5种或更多种由MHC展示的肽。在一些实施例中,经鉴定的由MHC展示的肽为抗原肽。在一些实施例中,样品为组织活检切片、细胞培养物、生物流体或经富集的源自生物样品的细胞。在一些实施例中,组织活检切片为健康组织的活检切片。在其他实施例中,组织活检切片为癌组织的活检切片。在一些实施例中,生物流体为血液、尿液或脑脊液。在其他实施例中,经富集的来自血流的细胞为树突细胞。在其他实施例中,样品为细胞培养物。在一些实施例中,MHC为I类MHC。在其他实施例中,MHC为II类MHC。

在一些实施例中,获得含有由MHC展示的肽的样品进一步包括富集由MHC展示的肽。在一些实施例中,获得含有由MHC展示的肽的样品进一步包括提取由MHC展示的肽。在一些实施例中,获得含有由MHC展示的肽的样品进一步包括富集并提取由MHC展示的肽。

在一些实施例中,由MHC展示的肽包含5个至20个氨基酸。在一些实施例中,由MHC展示的肽包含8个至12个氨基酸。在一些实施例中,用第二标记物标记该肽上的第二氨基酸残基。在一些实施例中,用第三标记物标记该肽上的第三氨基酸残基。在一些实施例中,用第四标记物标记该肽上的第四氨基酸残基。在一些实施例中,用第五标记物标记该肽上的第五氨基酸残基。在一些实施例中,用第一标记物、第二标记物和第三标记物标记该肽。在一些实施例中,标记物为荧光标记物。在一些实施例中,荧光标记物适用于在Edman降解条件下使用。在一些实施例中,荧光标记物选自氧杂蒽类染料、Atto染料、Janelia

在一些实施例中,该方法进一步包括将该肽固定在固体表面诸如树脂、微珠或玻璃表面上。在一些实施例中,该肽通过C末端、N末端或内部氨基酸残基固定。在一些实施例中,该肽通过C末端、N末端、赖氨酸残基或半胱氨酸残基固定,诸如通过C末端固定。在一些实施例中,经标记的第一氨基酸残基为内部氨基酸残基。

在一些实施例中,经标记的第一氨基酸残基选自半胱氨酸、赖氨酸、色氨酸、酪氨酸、天冬氨酸或谷氨酸。在一些实施例中,经标记的第一氨基酸残基为天冬氨酸或谷氨酸。在一些实施例中,该方法包括标记两种选自半胱氨酸、赖氨酸、色氨酸、酪氨酸、天冬氨酸或谷氨酸的氨基酸残基。在一些实施例中,两种氨基酸残基为赖氨酸和谷氨酸、赖氨酸和酪氨酸、谷氨酸和酪氨酸、赖氨酸和天冬氨酸、天冬氨酸和谷氨酸、天冬氨酸和酪氨酸、色氨酸和天冬氨酸、色氨酸和谷氨酸、赖氨酸和色氨酸、以及色氨酸和酪氨酸、半胱氨酸和天冬氨酸、半胱氨酸和谷氨酸、赖氨酸和半胱氨酸、半胱氨酸和酪氨酸、以及半胱氨酸和色氨酸。在一些实施例中,两种氨基酸残基为赖氨酸和谷氨酸、赖氨酸和酪氨酸、谷氨酸和酪氨酸、赖氨酸和天冬氨酸、天冬氨酸和谷氨酸、以及天冬氨酸和酪氨酸。

在其他实施例中,该方法包括标记三种选自半胱氨酸、赖氨酸、色氨酸、酪氨酸、天冬氨酸或谷氨酸的氨基酸残基。在一些实施例中,三种氨基酸残基为赖氨酸、谷氨酸和酪氨酸;赖氨酸、天冬氨酸和酪氨酸;赖氨酸、天冬氨酸和谷氨酸;天冬氨酸、谷氨酸和酪氨酸;赖氨酸、色氨酸和谷氨酸;赖氨酸、色氨酸和酪氨酸;赖氨酸、半胱氨酸和谷氨酸;色氨酸、谷氨酸和酪氨酸;赖氨酸、半胱氨酸和酪氨酸;赖氨酸、色氨酸和天冬氨酸;半胱氨酸、谷氨酸和酪氨酸;色氨酸、天冬氨酸和谷氨酸;赖氨酸、半胱氨酸和天冬氨酸;色氨酸、天冬氨酸和酪氨酸;半胱氨酸、天冬氨酸和谷氨酸;半胱氨酸、天冬氨酸和酪氨酸;半胱氨酸、色氨酸和天冬氨酸;半胱氨酸、色氨酸和谷氨酸;赖氨酸、半胱氨酸和色氨酸;以及半胱氨酸、色氨酸和酪氨酸。在一些实施例中,三种氨基酸残基为赖氨酸、谷氨酸和酪氨酸;赖氨酸、天冬氨酸和酪氨酸;赖氨酸、天冬氨酸和谷氨酸;天冬氨酸、谷氨酸和酪氨酸;赖氨酸、色氨酸和谷氨酸;赖氨酸、色氨酸和酪氨酸;赖氨酸、半胱氨酸和谷氨酸;以及色氨酸、谷氨酸和酪氨酸。

在一些实施例中,该肽在单分子水平上进行测序,诸如通过荧光测序方法对该肽进行测序。在一些实施例中,荧光测序方法包括测量每一种肽的荧光。在一些实施例中,每一种肽的荧光与存在的肽的数量相关。在一些实施例中,荧光测序方法包括去除末端氨基酸残基。在一些实施例中,末端氨基酸残基为N末端氨基酸。在其他实施例中,末端氨基酸残基为C末端氨基酸。在一些实施例中,通过酶去除末端氨基酸残基。在其他实施例中,通过Edman降解去除末端氨基酸残基。

在一些实施例中,荧光测序方法包括:

(A)测量肽的荧光;以及

(B)去除末端氨基酸残基。

在一些实施例中,该方法包括(i)测量肽的荧光和(ii)去除末端氨基酸残基3次至30次。在一些实施例中,重复8次至18次。

在一些实施例中,对该肽进行测序引起对该肽中一种或多种氨基酸残基的位置的鉴定。在一些实施例中,鉴定了该肽中一个、两个、三个或四个氨基酸残基的位置。在一些实施例中,鉴定了该肽中一种、两种、三种或四种类型的氨基酸残基的位置。在一些实施例中,对该肽进行测序引起对整个序列的鉴定。在一些实施例中,对该肽进行测序引起对该肽上一种或多种翻译后修饰的鉴定。在一些实施例中,翻译后修饰为糖基化或磷酸化。在一些实施例中,翻译后修饰为糖基化。在其他实施例中,翻译后修饰为磷酸化。

在一些实施例中,对该肽进行测序引起对由MHC展示的肽的数量的确定。在一些实施例中,对该肽进行测序引起对由MHC展示的每一种肽的数量的确定。在一些实施例中,该方法进一步包括获得该肽的荧光图谱,并将该图谱与该肽中一种或多种氨基酸残基的定位相关联。在一些实施例中,使用一种或多种算法关联该图谱。在一些实施例中,算法为netMHC、MHCFlurry、SYFPEITHI、netCHOP和netMHCpan。在一些实施例中,算法为netMHC。在其他实施例中,将该图谱与参考数据集相关联。在一些实施例中,参考数据集是从对细胞的生物信息学分析诸如对细胞蛋白质组的生物信息学分析中获得的。在其他实施例中,生物信息学分析是对细胞外显子组、转录组、HLA分型、核糖体足迹(Riboseq方法)的分析,或对蛋白质丰度、MHC蛋白质丰度的测量,对肽-MHC结合亲和力的测量。在其他实施例中,参考数据集是从外显子组和转录测序数据中获得的。在其他实施例中,参考数据集是从单独细胞系的人类白细胞抗原(HLA)分型中获得的。在其他实施例中,参考数据集是从健康组织样品诸如来自同一患者的健康组织样品中获得的。在其他实施例中,参考数据集是从已经通过测序从健康组织样品生成的健康组织样品中获得的。在一些实施例中,测序通过质谱法进行。在其他实施例中,测序通过荧光测序进行。在其他实施例中,测序通过核酸测序进行。在一些实施例中,核酸测序包括对DNA进行测序。在其他实施例中,核酸测序包括对RNA进行测序。在其他实施例中,测序通过与已知的肽文库比较进行。在一些实施例中,该方法包括进一步优化来自在荧光测序过程中获得的序列的参考数据集。

在其他方面,本公开提供从患者获得由MHC呈递的肽的数据库的方法,其包括:

(A)从患者获得MHC;

(B)分离由MHC呈递的肽;

(C)用第一标记物标记由MHC呈递的肽上的氨基酸残基;

(D)对由MHC呈递的肽进行测序;

(E)将由MHC呈递的肽的序列记录至数据库。

在一些实施例中,少于100,000种肽经鉴定。在一些实施例中,鉴定了每一种由MHC呈递的肽。在一些实施例中,患者为哺乳动物诸如人类。在一些实施例中,分离由MHC呈递的肽包括富集由MHC呈递的肽。在一些实施例中,通过免疫沉淀富集由MHC呈递的肽。在一些实施例中,分离由MHC呈递的肽包括从MHC分离由MHC呈递的肽。在一些实施例中,通过在酸性条件下处理而从MHC分离由MHC呈递的肽。

在一些实施例中,该方法进一步包括用第二标记物标记由MHC呈递的肽上的第二氨基酸残基。在一些实施例中,该方法进一步包括用第三标记物标记由MHC呈递的肽上的第三氨基酸残基。在一些实施例中,该方法进一步包括用第四标记物标记由MHC呈递的肽上的第四氨基酸残基。在一些实施例中,该方法进一步包括用第五标记物标记由MHC呈递的肽上的第五氨基酸残基。在一些实施例中,该方法包括标记第一氨基酸残基、第二氨基酸残基和第三氨基酸残基。在一些实施例中,第一标记物、第二标记物、第三标记物、第四标记物或第五标记物是荧光染料。在一些实施例中,第一标记物、第二标记物、第三标记物、第四标记物和第五标记物是荧光染料。在一些实施例中,荧光标记物适用于在Edman降解条件下使用。在一些实施例中,荧光标记物选自氧杂蒽类染料、Atto染料、Janelia

在一些实施例中,该方法进一步包括将该肽固定在固体表面诸如树脂、微珠或玻璃表面上。在一些实施例中,该肽通过C末端、N末端或内部氨基酸残基固定。在一些实施例中,该肽通过C末端、N末端固定。

在一些实施例中,该肽在单分子水平上进行测序,诸如通过荧光测序方法对该肽进行测序。在一些实施例中,荧光测序方法包括测量每一种肽的荧光。在一些实施例中,荧光测序方法包括去除末端氨基酸残基。在一些实施例中,末端氨基酸残基为N末端氨基酸。在其他实施例中,末端氨基酸残基为C末端氨基酸。在一些实施例中,通过酶去除末端氨基酸残基。在其他实施例中,通过Edman降解去除N末端氨基酸残基。

在一些实施例中,荧光测序方法包括:

(A)测量肽的荧光;以及

(B)去除末端氨基酸残基。

在一些实施例中,该方法包括将(i)测量肽的荧光和(ii)去除末端氨基酸残基重复3次至30次。在一些实施例中,重复8次至18次。在一些实施例中,对该肽进行测序引起对该肽中一种或多种氨基酸残基的位置的鉴定。在一些实施例中,鉴定了该肽中一个、两个、三个或四个氨基酸残基的位置。在一些实施例中,对该肽进行测序引起对整个序列的鉴定。在一些实施例中,对该肽进行测序引起对该肽上一种或多种翻译后修饰的鉴定。在一些实施例中,翻译后修饰为糖基化或磷酸化。在一些实施例中,翻译后修饰为糖基化。在其他实施例中,翻译后修饰为磷酸化。

在一些实施例中,该方法进一步包括获得该肽的荧光图谱,并将该图谱与该肽中一种或多种氨基酸残基的定位相关联。在一些实施例中,数据库是从细胞蛋白质组生物信息学分析的参考数据集中获得的。在其他实施例中,数据库是从外显子组和转录测序数据的参考数据集中获得的。在其他实施例中,数据库是从单独细胞系的人类白细胞抗原(HLA)分型的参考数据集中获得的。在其他实施例中,数据库是从健康组织样品诸如来自同一患者的健康组织样品的参考数据集中获得的。在其他实施例中,参考数据集是从已经通过测序从健康组织样品生成的健康组织样品中获得的。

又另一方面,本公开提供包含一种或多种肽的组合物,其中:

(A)该肽包含5个至20个氨基酸;

(B)该肽包含至少一个经标记的氨基酸残基,其中该氨基酸残基经第一标记物标记;并且

(C)该肽源自MHC。

在一些实施例中,该肽有8个至12个氨基酸。在一些实施例中,第一标记物为荧光标记物。在一些实施例中,该肽包含第二经标记的氨基酸残基,其中该氨基酸残基经第二标记物标记。在一些实施例中,第二标记物为荧光标记物。在一些实施例中,第一标记物和第二标记物产生不同的荧光信号。在一些实施例中,该肽为由MHC呈递的肽。在一些实施例中,该肽已经从MHC中去除。

又一方面,本公开提供鉴定受试者的HLA类型的方法,其包括:

(A)对本文中所述的与MHC有关的肽进行测序;以及

(B)将该肽与已知HLA比较以鉴定受试者的HLA类型。

在一些实施例中,对该肽进行测序鉴定了第二氨基酸残基的识别信息。在一些实施例中,对该肽进行测序鉴定了第九氨基酸残基的识别信息。在一些实施例中,对该肽进行测序鉴定了第二氨基酸残基和第九氨基酸残基的识别信息。

又另一个方面,本公开提供制备抗癌疗法的方法,其包括:

(A)对本文中所述的与MHC有关的肽进行测序;以及

(B)将该肽与已知的来自该患者的肽比较以确定由该患者特异性地呈递的与癌症有关的肽;并且

(C)使用由该患者特异性地呈递的与癌症有关的肽制备抗癌疗法。

在一些实施例中,该方法进一步包括将抗癌疗法施用于有此需要的患者。在一些实施例中,抗癌疗法为免疫疗法。在一些实施例中,患者为哺乳动物。在一些实施例中,患者为灵长动物诸如人类。在一些实施例中,该已知的肽来自同一患者。在一些实施例中,该已知的肽与非肿瘤组织样品有关。

另一方面,本公开提供用于分析主要组织相容性复合体(MHC)的方法,其包括对源自所述MHC的肽进行测序以鉴定所述肽的一种或多种氨基酸,从而鉴定所述肽或所述MHC。

在一些实施例中,该方法包括基本上同步地对源自所述MHC的其他肽进行测序以鉴定所述其他肽的序列。在一些实施例中,用至少一种可检测的标记物标记所述肽的至少一种类型的氨基酸残基,从而产生经标记的肽。在一些实施例中,所述至少一种可检测的标记物为荧光标记物。

在一些实施例中,用至少两种可检测的标记物标记所述肽的至少两种类型的氨基酸残基,从而产生经标记的肽。在一些实施例中,用可检测的标记物标记所述肽的少于所有类型的氨基酸残基,从而产生经标记的肽。在一些实施例中,所述可检测的标记物为荧光标记物。

在一些实施例中,在产生所述经标记的肽之前,用亲和性试剂诸如抗体处理所述肽。在一些实施例中,该方法进一步包括,在所述测序之前,将所述MHC片段化以得到多种肽,所述肽源自所述多种肽。在一些实施例中,鉴定所述肽或MHC包括鉴定所述肽的序列或所述肽的部分序列。在一些实施例中,所述测序为单分子测序。在一些实施例中,所述肽或所述MHC是从至少一个细胞分离的。在一些实施例中,所述肽或所述MHC是或源自人类白细胞抗原(HLA)、新抗原肽或其组合。在一些实施例中,该方法进一步包括对所述HLA、所述新抗原肽或所述其组合进行分析、验证或其组合。

另一方面,本公开提供用于分析主要组织相容性复合体(MHC)的方法,其包括对源自所述MHC的肽进行测序以鉴定所述肽的一种或多种氨基酸,其中对所述肽的鉴定是在单分子水平上发生的,从而鉴定所述肽或所述MHC。

又一方面,本公开提供用于分析主要组织相容性复合体(MHC)的方法,其包括对源自所述MHC的肽进行测序以鉴定所述肽的一种或多种氨基酸,从而鉴定所述肽或所述MHC,其中所述鉴定能够定量所述由MHC呈递的所述肽的数目。

另一方面,本公开提供用于分析主要组织相容性复合体(MHC)的方法,其包括对源自所述MHC的肽进行测序以鉴定所述肽的一种或多种氨基酸,从而鉴定所述肽或所述MHC,其中,当所述肽以小于100,000个所述肽拷贝的浓度存在时,该方法能够鉴定所述肽。

如本文中所使用的,就特定组分而言,“基本上不含”在本文中被用于表示未将任何特定组分故意配制成组合物和/或作为污染物或微量存在。因此,由组合物的任何意外污染而产生的特定组分的总量优选低于0.1%。最优选的是使用标准分析方法无法检测特定组分的组合物。

如本文在说明书和权利要求中所使用的,“一”或“一个(种)”可以意为一个(种)或多个(种)。如本文在说明书和权利要求中所使用的,当与字词“包括”结合使用时,字词“一”或“一个(种)”可以意为一个(种)或多于一个(种)。如本文在说明书和权利要求中所使用的,“另一”或“另一个(种)”可以意为第二个(种)或多个(种)。

如本文在说明书和权利要求中所使用的,术语“约”用于表示值包括用于确定该值的设备、方法的固有误差变化或研究对象之间存在的变化。除非基于上述值而另做指定,否则术语“约”意为所列数值的±5%。

通过下面详细的描述,本公开的其他目的、特点和优点将会变得显而易见。详细描述和特定实例(尽管指示本公开的某些实施例)通过举例的方式给出,因为在本公开的精神和范围内的各种变化和修改通过该详细的描述将变得显而易见。

附图说明

以下附图构成本说明书的一部分并包括在本说明书内,以进一步说明本公开的某些方面。通过参考这些附图中的一个或多个附图,结合在此呈现的具体实施例的详细描述,可以更好地理解本公开。

图1:用于单分子肽鉴定的荧光测序技术的实验说明。示出了用Edman溶剂交换法在TIRF显微镜上固定化多肽的实验装置(左图)。模型肽强度的阶跃下降突出了获得隐含序列或荧光序列的基础。

图2:MHC肽鉴定渠道。肿瘤和正常细胞样品的外显子组和转录组测序,与用于抗原预测的生物信息学工具偶联,将会生成预测的成组突变肽和未突变肽。来自通过肿瘤样品分离的抗原的荧光测序结果将提供对存在于突变抗原集中的肽的确认或改进预测。这种对这些抗原肽中的一些的正交确认表明下游测试和处理方式的风险较低。

图3:MHC肽鉴定量表的概念化。量表表明通过不同方法可获得的MHC肽序列的信息含量。如果对全部该肽进行从头测序,则完全鉴定是可能的。另选地,如果氨基酸无一可被测序,则不存在关于MHC肽库的信息。然而,取决于可被标记的氨基酸数目和所采用的策略,MHC肽鉴定接近这一量表的从头测序终点。

图4:可使用简单的氨基酸标记方案将大量的HLA表位可视化。IEDB数据仓中超过80%的HLA-A2表位具有可帮助将这些肽可视化的氨基酸诸如天冬氨酸盐/谷氨酸盐和酪氨酸。这一分析表明这些表位中的绝大多数具有可被标记已进行荧光测序的氨基酸。

图5A和图5B:通过不同标记选择进行MHC肽鉴定。对所有“黑色素瘤”过滤肽的数据集(来自IEDB.org)的分析突出了使用荧光测序技术获得MHC肽鉴定的可能性。如图5A所示,标记两种氨基酸(K,E)可独特地鉴定约25%的肽序列,并且高达60%的观察到的荧光序列可缩窄为至多5种肽。同样,通过标记MHC肽上的氨基酸K、E和Y(图5B),高达80%的观察到的荧光序列可缩窄为5种潜在的肽序列。

图6:从B细胞培养物分离MHC肽。实施B细胞的裂解,并使用以(泛MHC抗体)功能化的磁珠分离MHC复合体。洗脱并纯化结合的HLA肽,然后使用串联质谱法分析。

图7A和图7B:HLA分离方法的验证。通过质谱分析所分离的肽以进行确认。柱状图(图7A)表明基于预测算法netMHC而归为三个类别的来自两个细胞系的肽的计数。超过50%的所预测肽是强结合物。肽的基序分析通过logo描述(图7B)。它清楚地示出HLA-A2603细胞系上的酸性残基(在位置1处)和精氨酸(在位置9处)的富集以及HLA-B0702细胞系中脯氨酸(在位置2处)的富集,这与早前关于等位基因优先性的报告一致。

图8:文氏图,其表明通过三种方法(即,质谱法、比较性RNA序列分析和预测软件)鉴定的肽。

图9:标记肽并进行荧光测序(在细胞系之间比较)。通过观察酸性残基的富集频率来实施对来自两个单等位基因细胞系的肽的比较。质谱数据和荧光序列图谱以柱状图呈现,并且提供两种方法之间相关性的证据。

图10:获得使用荧光测序技术检测靶标HLA抗原的检测限。将靶标肽以递减的浓度添加(spike)至HLA背景中,并使用荧光测序进行测量。将靶标肽荧光序列图谱的技术绘制为输入浓度(呈现在x轴中)的函数。荧光测序检测限为大约1个分子/10个细胞。

图11:荧光测序用于对HLA肽进行测序。HLA肽可从实体肿瘤、液体活检切片和其他细胞来源分离。分析HLA肽可以是诸如以下的发现:预测或辅助对新抗原或肿瘤相关抗原的发现,或作为用于患者选择或监控的确认方法。

图12:示出MHC肽处理和呈递的细胞途径的简化图示。发生在细胞基础基因组中的肿瘤相关或特异性的突变被转录并翻译为异常蛋白。这些肿瘤蛋白被蛋白酶体修饰、消化、在分泌途径中处理并呈递在HLA复合体上。这些展示的肽是用于T细胞识别及其产生下游细胞溶解活性和免疫激活的能力的基础。

具体实施方式

在一些方面,本公开提供将由主要组织相容性复合体(MHC)呈递的肽分型、鉴定、定量或定位的方法。在一些方面,本文提供的方法包括使用荧光测序方法来鉴定由MHC呈递的肽中的特定氨基酸残基的识别信息。这些经鉴定的氨基酸残基可用来使用算法及/或其他计算方法鉴定肽,或可从头获得完整序列。此外,本发明的方法可用来定量由MHC呈递的特定肽。

荧光测序方法适合辅助鉴定由MHC呈递的抗原肽。荧光测序方法基于以下原理:肽中少量氨基酸类型的位置信息(诸如xCxxC;x=任何氨基酸;C=半胱氨酸)可能充分反映肽的识别信息,以允许在已知的蛋白质序列数据库中对其进行鉴定。为了使实验得以实现,用荧光团选择性地标记该肽的一种或多种氨基酸,通过Edman化学法依序降解位于载玻片上的固定化肽,并平行地监控每个肽随着其在每个循环中失去一个氨基酸而发生的荧光强度变化。图1示出以荧光团在位置2和位置5处的半胱氨酸分子上进行标记的单独肽分子的单分子荧光测序数据(Swaminathan等人,2014;Swaminathan等人,收录于2018)。这一方法已经用于基于二色标记而鉴定受控混合物中的单独肽分子,由于光漂白和错过的Edman循环而存在一定程度的误差。这一方法的所得检测阈值比肽质谱法提高了将近六个数量级。

I.肽测序方法

存在许多种鉴定肽的序列的方法,包括荧光测序、质谱法、从核酸序列中鉴定肽序列和Edman降解。已发现,荧光测序为感兴趣的蛋白质的测序提供单分子分辨率(Swaminathan,2010;美国专利号9,625,469;美国专利申请序列号15/461,034;美国专利申请序列号15/510,962)。荧光测序的特征之一是将荧光团或其他标记物引入肽序列的特定氨基酸残基中。这可涉及引入具有独特标记部分的一种或多种氨基酸残基。在一些实施例中,用标记部分标记一个、两个、三个、四个、五个、六个或更多个不同的氨基酸残基。可使用的标记部分包括荧光团、发色团或猝灭剂。这些氨基酸残基中的每一个可包括半胱氨酸、赖氨酸、谷氨酸、天冬氨酸、色氨酸、酪氨酸、丝氨酸、苏氨酸、精氨酸、组氨酸、甲硫氨酸、天冬酰胺和谷氨酰胺。这些氨基酸残基中的每一个可用不同的标记部分标记。在一些实施例中,多个氨基酸残基可用相同的标记部分(诸如天冬氨酸和谷氨酸或天冬酰胺和谷氨酰胺)标记。虽然该技术可与诸如上述那些的标记部分一起使用,但也设想,在类似荧光测序方法中可使用其他标记部分,诸如可使用合成的寡核苷酸或肽-核酸。具体地,本申请中使用的标记部分可适于承受去除氨基酸残基中的一个或多个的条件。可用于本发明方法中的潜在标记部分的一些非限制性示例包括在红色至红外光谱中发射荧光信号的那些,诸如Alexa

另选地,合成的寡核苷酸或寡核苷酸衍生物可用作肽的标记部分。例如,硫醇化的寡核苷酸是可商购的,并且可使用已知方法与肽偶联。通常可用的硫醇修饰为5′硫醇修饰、3′硫醇修饰和二硫醇修饰,并且这些修饰中的每一种可用于修饰肽。在寡核苷酸偶联至上述肽之后,肽可经受Edman降解(Edman等人,1950)并且寡核苷酸可用于确定剩余肽序列中特定氨基酸残基的存在。在其他实施例中,标记部分可为肽-核酸。肽-核酸可连接至特定氨基酸残基上的肽序列。

荧光测序的一个要素是通过此类技术(诸如Edman降解和后续可视化)去除经标记的肽以检测荧光值的减小,从而指示特定氨基酸已被切割。通过多种不同的技术(包括Edman降解和蛋白水解切割)执行每个氨基酸残基的去除。在一些实施例中,这些技术包括使用Edman降解来去除末端氨基酸残基。在其他实施例中,这些技术涉及使用酶来去除末端氨基酸残基。可从肽链的C末端或N末端去除这些末端氨基酸残基。在其中使用Edman降解的情况中,去除肽链的N末端处的氨基酸残基。

在一些方面,肽序列的测序或成像方法可包括将肽固定在表面上。肽可使用内部氨基酸残基诸如半胱氨酸残基、N末端或C末端固定。在一些实施例中,通过使半胱氨酸残基与表面反应来固定肽。在一些实施例中,本公开设想将肽固定在表面上,诸如在可见光谱和/或红外光谱上光学透明、折射率介于1.3和1.6之间、厚度介于10nm至50nm之间、和/或耐有机溶剂以及强酸(诸如三氟乙酸)化学腐蚀的表面上。广泛的底物(如含氟聚合物(Teflon-AF(Dupont)、

最后,这些测序技术中的每一种涉及使肽序列成像以确定肽序列上一个或多个标记部分的存在。在一些实施例中,在每次去除氨基酸残基之后拍摄这些图像,并使用这些图像确定肽序列中特定氨基酸的位置。在一些实施例中,该方法可引起阐明肽序列中特定氨基酸的位置。这些方法可用于确定肽序列中特定氨基酸残基的位置,或这些结果可用于确定肽序列中氨基酸残基的整个列表。该方法可涉及确定肽序列中一种或多种氨基酸残基的位置,并将这些位置与已知肽序列进行比较并确定肽序列中氨基酸残基的整个列表。

在一些方面,该方法可包括在已经将肽与MHC分离之后标记一种或多种氨基酸残基。如果在肽上标记多于一个位置,则设想可以按以下顺序标记氨基酸:半胱氨酸、赖氨酸、N末端、C末端、和/或在侧链上具有羧酸基团的氨基酸、和/或色氨酸。设想可标记这些具体氨基酸中的一种或多种,或者可用不同标记物标记这些氨基酸残基的全部。

在一些方面,用于测序技术的成像方法可涉及多种不同的方法,诸如荧光测定法和荧光显微法。荧光方法可采用此类荧光技术,诸如荧光偏振、荧光共振能量转移(FRET)或时间分辨荧光。在一些实施例中,荧光显微法可用于确定单分子数量的一个或多个荧光团的存在。此类成像方法可用于确定特定肽序列上是否存在标记物。在去除氨基酸残基并使肽序列成像的重复循环之后,可在肽中确定经标记的氨基酸残基的位置。

在一些实施例中,本公开提供将肽与MHC的其他组分分离的方法。一些方法是文献中已知的,诸如在Yadav等人,2014和Müller等人,2006中描述的那些,两篇文献通过引用并入本文。可通过使用特异性结合元件诸如抗体将样品中的MHC捕获在微珠上而富集。用于这一目的的微珠是本领域众所周知的,并且包括可以与抗体结合的任何固体支持物。例如,抗体是MHC等位基因特异性的抗体或泛特异性抗体诸如靶向全部不同MHC等位基因的W6/32抗体。一旦MHC已经通过与微珠结合并洗脱其他组分而得以富集,就可以使用弱酸性溶液去除肽。这种溶液可包括含有0.1%至约2.5%的弱酸的水溶液。在一些实施例中,该溶液可含有约0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1.0%、1.2%、1.4%、1.6%、1.8%、2.0%或2.5%或本文中可推导出的任何范围。可用于去除肽的方法中的酸的一些非限制性示例包括甲酸、乙酸、柠檬酸、三氟乙酸、盐酸或硫酸。一旦与MHC分离,这些肽就可以用于上述测序方法中。

本文所述方法对单分子水平敏感。本文所述方法的灵敏度可透露基本上全部源自MHC的肽的识别信息。本文所述方法的灵敏度可透露每种源自MHC的肽的识别信息。本文所述的方法可透露至多100,000种肽、90,000种肽、80,000种肽、70,000种肽、60,000种肽、50,000种肽、40,000种肽、30,000种肽、20,000种肽、10,000种肽、5,000种肽、4,000种肽、3,000种肽、2,000种肽、1,000种肽、500种肽、100种肽、50种肽、10种肽、5种肽、2种肽或1种肽的识别信息。本文所述的方法可透露至少1种肽、2种肽、5种肽、10种肽、50种肽、100种肽、500种肽、1,000种肽、2,000种肽、3,000种肽、4,000种肽、5,000种肽、10,000种肽、20,000种肽、30,000种肽、40,000种肽、50,000种肽、60,000种肽、70,000种肽、80,000种肽、90,000种肽或100,000种肽的识别信息。本文所述的方法可透露100,000种肽至1种肽、50,000种肽至1种肽、10,000种肽至1种肽、5,000种肽至1种肽、1,000种肽至1种肽、500种肽至1种肽、100种肽至1种肽、10种肽至1种肽或5种肽至1种肽的识别信息。

Ⅱ.主要组织相容性复合体(MHC)

主要组织相容性复合体(MHC)是身体用来识别外来分子的一系列细胞表面蛋白,并且是获得性免疫系统的关键因素。这些蛋白与抗原结合,然后将该抗原展示在它们的表面上,使得该抗原被T细胞识别。存在三个主要的I类MHC单体型(A、B和C)和三个主要的II类MHC单体型(DR、DP和DQ)。人体中的MHC也称为人类白细胞抗原(HLA)复合体。I类MHC蛋白可以进一步包含其他元件诸如辅助抗原呈递的分子诸如TAP和甲巯蛋白。

I类MHC蛋白一般包含三个结构域,标记为α1、α2和α3。α1结构域发挥作用以将MHC连接至β-微球蛋白,α3发挥作为跨膜结构域的作用,将蛋白质锚定在细胞膜中,并且介于α1亚基与α2亚基之间的沟槽作为肽呈递结构域而发挥作用。另一方面,II类MHC蛋白具有两个结构域,每个结构域具有两类蛋白亚基α和β。第一结构域包含α1和α2亚基,而第二结构域包含β1和β2亚基。α2和β2形成该蛋白质的将MHC锚定到细胞膜的跨膜结构域,并且α1亚基和β1亚基形成肽结合沟槽。

HLA基因座是高度多态性的,并且在染色体6上分布超过4Mb。由于这一区域与自体免疫和感染性疾病有关,将该区域内的HLA基因单体型的能力在临床上很重要,并且HLA单体型在供者与受者之间的相容性可能影响移植的临床结果。对应于I类MHC的HLA将来自细胞内部的肽呈递给T淋巴细胞,而对应于II类MHC的HLA将来自细胞外部的肽呈递给T淋巴细胞。MHC单体型在移植物与宿主之间的不相容性触发针对移植物的免疫应答并引起其排异。因此,可使用免疫抑制剂治疗患者以预防排异。HLA匹配的干细胞系可以克服免疫排异的风险。

因为HLA在移植中的重要性,目前存在若干种类型的鉴定MHC(或HLA)的方法。传统上,HLA基因座往往通过血清学和PCR分型,以鉴定有利的供受者配对。可使用经纯化的T或B淋巴细胞进行补体介导的淋巴细胞毒性测试,完成对I类和II类HLA抗原的血清学检测。这一过程主要用于匹配HLA-A基因座与HLA-B基因座。基于分子的组织分型往往比血清学测试更准确。低分辨率分子方法诸如SSOP(序列特异性寡核苷酸探针)法,其中PCR产物是针对一系列寡核苷酸探针而测试的,可用来鉴定HLA抗原,并且目前这些方法是用于II类HLA分型的最常用方法。高分辨率技术诸如SSP(序列特异性引物)法,其利用等位基因特异性引物进行PCR扩增,可鉴定特定MHC等位基因。

Ⅲ.来自主要免疫相容性复合体的肽和从MHC获得的肽的治疗性用途

从MHC获得的肽可以从患者获得。患者可以是哺乳动物诸如人类。这些肽可以从样品诸如组织活检切片、细胞培养物或经富集的源自生物样品的细胞。生物样品可以从血流获得,或者从体液诸如血液、唾液、尿液或淋巴液获得。在一个实施例中,经富集的细胞可以是树突细胞。组织活检切片可以是对健康组织进行活检切片或对癌组织进行活检切片的结果。

在一些实施例中,该方法包括鉴定2、3、4、5或6种由MHC展示的肽序列的序列。该肽可进一步从MHC富集并且从MHC提取。从MHC获得的肽可具有约5至约20个氨基酸残基的长度。在一些实施例中,所鉴定的MHC肽具有5、6、7、8、9、10、11、12、13、14、15、16、17、18、19至约20个氨基酸残基,或本文可推导出的任何范围内的氨基酸残基。这些肽可进一步包含一种或多种翻译后修饰诸如糖基化或磷酸化。这些方法可用来定量由MHC展示的一种或多种肽。

A.免疫疗法的前景与痛点

当每4位进行针对急性成淋巴细胞性白血病免疫疗法的患者中有3位在18个月后显示完全缓解时,它定义了一个令人振奋且充满希望的抗癌时期(Maude等人,2018)。自从2011年伊匹单抗

由于大多数类别的免疫疗法(即,T细胞疗法(CAR和TCR)、癌症疫苗和检查点抑制剂)工程化或操纵身体的T细胞(Pham等人,2018),对患者进行分层的一个强有力的标准可以是直接分析与T细胞相互作用的生物分子的特性。T细胞受体(TCR)识别由人类白细胞抗原(HLA)-1复合体展示在细胞表面上的长度为8至12个氨基酸的短肽。图12示出了用于生成和呈递这些肽的简化细胞途径。由病毒感染或肿瘤相关突变所致的功能失调蛋白质组反映在所呈递的一组HLA-I肽中。因此,这些肽用作T细胞参与、激活、免疫应答和清除的信号(Neefjes等人,2011)。肿瘤相关肽和肿瘤特异性肽(新抗原)两者均为基于T细胞的疗法和癌症疫苗的靶标(Goodman等人,2017;Schumacher和Schreiber,2015),因此,这些肽的存在可以提供免疫疗法效力的最佳相关性。直接从活检切片鉴定的HLA-I结合肽可给出新的、高度互补的诊断方法,以将患者与现有免疫疗法配对。

B.直接从肿瘤活检切片获得HLA肽所需的方法

目前,直接从患者肿瘤样品对HLA-I结合肽进行测序和定量存在一个技术“盲点”(Brennick等人,2017)。该挑战是由于(a)它们的丰度极低,每个细胞展示的每种肽低至10个拷贝,以便触发T细胞识别;(b)每个样品中存在高达10,000种不同TAA肽的高度异质性群体;和(c)对处理和展示突变肽的个性化肿瘤相关途径的理解不完全(Yewdell等人,2003)。尽管质谱可以鉴定肽,但其灵敏度极其有限,需要约一百万个拷贝(分子)的单一肽以产生可检测的信号。这将它的用途限定在对来自可扩展的细胞系的肽进行编目,而不是对规模更为有限的直接来自典型肿瘤活检切片的肽进行编目(Caron等人,2017)。另选地,肽预测算法可以预测抗原肽,例如,通过使用HLA结合基序、结合亲和性和蛋白酶体切割模式的计算机模型整合从肿瘤活检切片获得的外显子组和转录组序列(Lee等人,2018)。目前,此类算法显示彼此之间的一致性很小,并且它们鉴定肿瘤特异性肽和肿瘤相关肽的能力在盲法试验中很少是对的(Vitiello和Zanetti,2017)。

C.建立临床相关性:

通过HLA-I肽测序来改进患者选择和结果

今天,患者筛查依赖于替代工具诸如RT-PCR或全外显子测序来确认所表达的基因或突变。例如,就多发性骨髓瘤TCR疗法而言,最初筛查了20位患者的经表达的全长NY-ESO-1mRNA,但没有筛查实际展示的HLA-I肽,而该疗法是针对HLA-I肽开发的(Robbins等人,2015)。将经工程化的T细胞引入患者而没有直接确认肿瘤上的靶标抗原,在不知道潜在疗效的情况下将患者置于自身免疫反应或细胞因子释放综合征的风险下(Shimabukuro-等人,2018)。现在,已经鉴定了大量的治疗性肽靶标并将其在不断拓展的公共数据库(iedb.org)和私有数据库(公司)中编目(Caron等人,2017)。需要一种直接从肿瘤活检切片中鉴定这些经确认的肽抗原的快速测定法来帮助向患者分派预先设计的T细胞或疫苗。

大量的免疫疗法治疗都是基于靶向HLA-I结合肽抗原的,可能从这种测定法中受益(Lee等人,2018)。这些类型的免疫疗法,我们称之为聚焦抗原的免疫疗法,其包括:(a)内源性T细胞疗法(ETC),其中,将肿瘤抗原特异性T细胞从患者外周血中分离、体外扩展并且输注回患者体内;(b)TCR T细胞疗法,其中,将患者T细胞工程化以表达肿瘤抗原特异性TCR;和(c)癌症疫苗,其中,使用肽新抗原的混合液将患者免疫化,以便激活抗肿瘤T细胞应答(Pham等人,2018)。

Ⅳ.定义

如本文所使用的,术语“氨基酸”通常是指含有至少一个氨基基团—NH

如本文所使用的,术语“末端”是指单个末端和多个末端。

如本文所使用的,术语“侧链”或“R”是指连接到α碳的独特结构(连接氨基酸的胺和羧酸基团),该独特结构向每种类型氨基酸赋予独特性。R基团具有多种形状、尺寸、电荷和反应性,诸如带正电荷或负电荷的带电极性侧链,诸如赖氨酸(+)、精氨酸(+)、组氨酸(+)、天门冬氨酸(-)和谷氨酸盐(-),氨基酸也可为碱性的(诸如赖氨酸)或酸性的(诸如谷氨酸);不带电极性侧链具有羟基、酰胺或硫醇基团,诸如具有化学反应性侧链的半胱氨酸,即可与另一种半胱氨酸、丝氨酸(Ser)和苏氨酸(Thr)形成键并具有不同尺寸的羟基R侧链的硫醇基团;天冬酰胺(Asn)、谷氨酰胺(Gln)和酪氨酸(Tyr);非极性疏水氨基酸侧链包括氨基酸甘氨酸;具有脂肪族烃侧链的丙氨酸、缬氨酸、亮氨酸和异亮氨酸,该脂肪族烃侧链的尺寸在甲基基团(就丙氨酸而言)至同分异构丁基基团(就亮氨酸和异亮氨酸而言)的范围内;甲硫氨酸(Met)具有硫醇醚侧链,脯氨酸(Pro)具有环吡咯烷侧基团。苯基丙氨酸(具有苯基部分)(Phe)和色氨酸(Trp)(具有吲哚基团)含有通过大体积以及非极性表征的芳族侧基团。

氨基酸也可通过名称或3字母代码或1字母代码指代,例如,分别为半胱氨酸;Cys;C,赖氨酸;Lys;K,色氨酸;Trp;W。

氨基酸可被归类为营养必需或非必需氨基酸,需要说明的是非必需氨基酸与必需氨基酸可因生物体而不同,或者可在不同发育阶段而不同。具体生物体的非必需或条件性氨基酸是在机体中使用由若干基因编码的酶通常在途径中充分地合成的氨基酸,因为底物用于蛋白质合成。必需氨基酸是通过从头途径生物体不能产生或不能自然地产生的氨基酸,例如人类中的赖氨酸。人类通过饮食获得必需氨基酸,包括合成的补充剂、肉、植物和其他生物体。

“非天然”氨基酸是既不是天然编码或可见于遗传密码中的,也不是通过从头途径在哺乳动物或植物中产生的那些氨基酸。它们可通过添加非正常存在或自然界中很少存在于氨基酸上的侧链来合成。

如本文所使用的,如在20种标准生物氨基酸中其氨基基团键合到β碳而不是α碳上的β氨基酸是非天然氨基酸。常见天然存在的β氨基酸是β-丙氨酸。

如本文所使用的,术语“氨基酸序列”、“肽”、“肽序列”、“多肽”和“多肽序列”在本文可互换使用,是指通过肽(酰胺)键或肽键的类似物共价连接的至少两个氨基酸或氨基酸类似物。术语“肽”包括氨基酸或氨基酸类似物的低聚物或聚合物。术语“肽”也包括通常含有约两(2)个至约二十(20)个氨基酸的通常被称为肽的分子。术语“肽”也包括通常含有约二十(20)个至约五十(50)个氨基酸的通常被称为多肽的分子。术语“肽”也包括通常含有约五十(50)个至约三千(3000)个氨基酸的通常被称为蛋白质的分子。肽的氨基酸可为L-氨基酸或D-氨基酸。肽、多肽或蛋白质可为合成的、重组的或天然存在的。合成的肽是在体外人为产生的肽。

如本文所使用的,术语“子集”是指单独肽分子的N-末端氨基酸残基。具有N-末端赖氨酸残基的单独肽分子的“子集”与具有非赖氨酸N-末端残基的单独肽分子的“子集”区分开。

如本文所使用的,术语“荧光”是指可见光被已吸收具有不同波长的光的物质发射。在一些实施例中,荧光提供了基于特定波长下荧光的发射而追踪生物分子和/或分析生物分子的非破坏性方式。蛋白质(包括抗体)、肽、核酸、寡核苷酸(包括单链和双链引物)可用被称为荧光团的多种外在荧光分子“标记”。

如本文所使用的,肽“在单分子水平下”的测序是指从不同肽分子混合物中的单独(即单一)肽分子中获得的氨基酸序列信息。本公开可不限于其中从单独肽分子中获得的氨基酸序列信息是单独肽分子的完整或连续的氨基酸序列的方法。在一些实施例中,获得部分氨基酸序列信息是足够的,从而允许鉴定肽或蛋白质。部分氨基酸序列信息(包括例如单独肽分子内特定氨基酸残基(即赖氨酸)的模式)可足以独特地鉴定单独肽分子。例如,可搜索给定生物体的已知蛋白质组的指示赖氨酸分子在单独肽分子内的分布的氨基酸模式诸如X-X-X-Lys-X-X-X-X-Lys-X-Lys以鉴定单独肽分子。肽在单分子水平下的测序并非旨在局限于鉴定赖氨酸残基在单独肽分子中的模式;任何氨基酸残基(包括多个氨基酸残基)的序列信息均可用于鉴定不同肽分子的混合物中的单独肽分子。

如本文所使用的,“单分子分辨率”是指从不同肽分子的混合物中的单独肽分子中采集数据(包括例如氨基酸序列信息)的能力。在一个非限制性示例中,可将不同肽分子的混合物固定在固体表面(包括例如,载玻片或其表面已被化学修饰的载玻片)上。在一个实施例中,这可包括同时记录分布在玻璃表面上的多种单独(即单一)肽分子的荧光强度的能力。可以以这种方式应用的光学装置是可商购的。例如,可获得配备有全内反射照射和强化电荷耦合器件(CCD)检测器的常规显微镜(参见Braslaysky等人,2003)。用高灵敏度CCD相机成像允许仪器同时记录分布在表面上的多个单独(即单一)肽分子的荧光强度。在一个实施例中,图像收集可使用图像分割器进行,该图像分割器将光线引导通过两个带通滤波器(适于每种荧光分子的带通滤波器)以在CCD表面上记录为两幅并排图像。使用具有自动对焦控件的机动显微镜载物台来将流通池中的多个载物台位置成像可允许在一个实验中对数百万的单独单肽(或更多)进行测序。

如本文所使用的,术语“标记”是将化学基团引入分子中,这生成某种形式的可测量信号。这种信号可包括但不限于荧光、可见光、质量、辐射或核酸序列。

属性概率质量函数—对于给定荧光序列,其源蛋白质的后验概率质量函数即每种源蛋白质p

V.实例

包括以下实例以说明本公开的优选实施例。以下实施例中公开的技术代表本发明人发现的在本公开的实践中发挥良好作用的技术,因此可以被视为构成本公开实践的优选模式。然而,根据本公开,在不脱离本公开的精神和范围的情况下,可以对所公开的特定实施例进行许多改变而仍获得相同或相似的结果。

实例1–使用通过测序获得的识别信息和数量剖析与MHC结合的肽

用于剖析MHC肽的方法汇总在图2中。大体上,该方法细分为四个部分:(a)用于从生物样品提取并富集MHC结合肽的过程,(b)用荧光团标记氨基酸并实施荧光测序数据,(c)对该生物样品实施基因组和转录组测序,以及(d)将荧光测序数据和基因组数据与生物信息学分析整合以获得潜在MHC肽序列的列表。这些实施例各自在下文中更详细地阐述。

A.提取MHC结合肽:

多种用于富集和提取MHC结合肽的方法已经在文献中充分描述(Yadav等人,2014;Müller等人,2006)。首先将细胞和组织溶解,并通过免疫沉淀方法富集MHC蛋白。简单地说,将MHC-I等位基因特异性抗体(或泛等位基因抗体,取决于实验)固定在微珠上,并且MHC-I蛋白得以富集。通过用弱酸(诸如0.2%至1%甲酸)轻柔地处理这一蛋白混合物,与MHC-I复合体结合的肽得以释放。收集这些肽并冻干,以备下游使用。生物样品的来源可以是肿瘤活检切片、健康组织活检切片、细胞培养物、经富集的来自血流的细胞(诸如树突细胞)或其他合适的来源。如果出现可从同一患者获得肿瘤样品和匹配的对照样品的情况,则这可引起个性化的MHC肽被提取并鉴定,这一疗法特性称为“个性化”疗法。无论经匹配样品的来源或具体存在如何,提取方法的最终产物都是肽池。

B.MHC结合肽的荧光测序:

使在A中获得的所提取MHC肽进行用于荧光测序中的标记过程。

(i)肽的标记:

早前已经描述了标记不同氨基酸(即,半胱氨酸、赖氨酸、色氨酸和天冬氨酸/谷氨酸)的策略(Swaminathan等人,2014;Hernandez等人,2017)。可以想象,也可以实施标记酪氨酸、甲硫氨酸、组氨酸和经翻译后修饰(磷酸化和糖基化)的氨基酸残基(Swaminathan等人,2014;Phatnami和Greenleaf,2006;Stevens等人,2005)。实验上,可通过随机亚取样或经由分馏方法将肽样品分成多个部分,诸如通过盐或pH梯度柱将肽分离为不同的等分小样。这些等分小样各自将会使用氨基酸选择性荧光团的子集进行荧光标记。在一个可想象的实施方式中,将等分小样中各自进一步细分并使用氨基酸选择性荧光团的不同子集进行标记。依据MHC肽样品的浓度,可进行直接荧光标记。

(ii)经标记的肽的荧光测序:

已经如先前所述对经荧光标记的肽的群体进行测序(Swaminathan,2010;美国专利号9,625,469;美国专利申请序列号15/461,034;美国专利申请序列号15/510,962)。由于MHC肽的典型长度为9个至11个氨基酸,实施大约10次至15次循环的实验循环(一个循环包括一次Edman降解化学法和一轮光栅扫描载玻片表面以获得跨多个荧光通道的全部肽的图像)。分析通过Edman循环获得的每个肽分子的强度轨迹,并获得荧光序列。将实验中不同生理化学过程的效率信息(诸如光漂白速率和Edman效率)组合之后,生成了荧光序列的列表及其计数和置信度得分。

C.建立用于匹配荧光序列的表位参考数据库:

从B获得的荧光序列的列表可以与参考数据库匹配以确定其确切的肽序列。参考数据库的构建(例如,全部MHC肽序列的潜在集合)需要对基础细胞蛋白质组进行生物信息学分析。但是由于细胞蛋白质组中存在的全部蛋白质和肽难以进行分类,研究者往往使用外显子组和转录组测序数据来推断MHC肽列表。从基因组信息预测MHC肽需要两个相关的信息来源:(a)所表达蛋白质的群体(可从外显子组或转录组数据获得)和(b)单独细胞系的HLA分型(6种不同HLA等位基因的集合)。因此,在通过荧光测序进行MHC肽测序的渠道中,要么(a)实施对细胞或组织活检切片的基因组(或外显子组)和转录组测序,要么(b)使用可以得到上述两种信息的可公开获得的关于特定生物样品的数据集。

可获得多种使用外显子组和转录组数据来推断MHC肽序列的可公开获得的预测算法(Backert和Kohlbacher,2015)。计算分析起源于经潜在翻译蛋白质的长度为9个至11个氨基酸的肽的二级结构、MHC结合强度、转录水平丰度、蛋白质组切割效率等,以确定其被作为MHC结合肽呈递的可能性(Schumacher和Schreiber,2015)。肽的这一经排序的列表是关于与所观察的荧光序列匹配的模式的参考数据集。当对从肿瘤活检切片和匹配的对照样品(仅外显子组或基因组数据)获得的列表进行比较时,可确定肿瘤相关抗原或肿瘤特异性抗原。如果荧光序列鉴定或匹配这些MHC肽序列,则该荧光测序技术可用于发现并确认新抗原。这一数据集的一个可选来源可以是经质谱鉴定的肽。假发现得分高时,肽列表具有更多的假阳性数据,但与预测算法组合可涵盖比仅使用预测算法输出时更丰富的数据集。

D.将荧光测序数据与参考数据集匹配:

B的结果是荧光序列的列表以及所观察的计数和其观察结果的置信度得分。C的结果是肽序列的数据集,要么是从预测算法排序,要么是来自可公开获得来源的表位数据集。很可能地,鉴于(a)可被选择性标记的氨基酸基团很少和(b)肽长度较短(9个至11个氨基酸长),荧光序列与所预测数据集中的肽的独特匹配度低。然而,鉴于荧光序列的直接观察结果,可使用这一正交信息对经排序的肽列表重新加权并且生成一个新的经排序的肽列表。也可能的是,所观察的荧光序列可以匹配并证实在参考列表中排名更高的肽。可研发评分系统以将荧光序列与参考数据集匹配,其中较高的权重值归因于在数据集的其他肽中具有较低匹配频率的荧光序列,并且证实了具有更高排名的肽。

实例2-计算机模拟荧光测序以验证其在MHC肽剖析中的应用

对MHC肽进行荧光测序以进行鉴定提供了两个极端之间的序列的信息含量,如图3中的简单示意图所示。在量表的一端,当无一氨基酸被标记时,没有MHC肽的信息。在量表的另一端,全部氨基酸识别信息都是已知的,MHC肽可得以完全鉴定。通过荧光测序进行的部分氨基酸标记方案位于这一信息量表的中部。为了确定荧光测序导出的信息在该量表上的位置,模拟了不同的标记方法,以确定最大化信息含量的标记策略并且验证其作为MHC肽剖析工具的应用。

以下两种模拟研究强调了荧光测序技术获取可公开获得的MHC肽信息含量的可行性。

(i)可被标记的氨基酸的存在:

虽然二十种天然出现氨基酸中的六种可以被标记以进行荧光测序;但其在MHC肽序列中如何表现尚不明确。为了确定对于荧光测序而言甚至可见的假定MHC肽的百分比,从IEDB数据仓(www.iedb.org/)中选择了HLA-A2等位基因呈递的表位(通过使用结合测定确认进行过滤)。图4示出,通过仅标记两种氨基酸的荧光测序方法,可检测12,160种MHC中的超过75%。在用于标记氨基酸的不同选择中,谷氨酸残基和天冬氨酸残基的标记显著增加了覆盖率。可以想象,标记超过2个氨基酸将进一步增加可通过荧光测序检测的肽的数目。这一分析不能证明对表位的独特鉴定,但简单地强调了荧光测序观察MHC结合肽的可行性。

(ii)通过荧光测序独特地鉴定和确认MHC表位:

在癌症类型中,已经观察到黑色素瘤细胞系携带最高的突变负载。为了发现可用于荧光测序的标记方案能否独特地鉴定或确认已知的MHC表位,从IEDB数据仓中选择已经出现在黑色素瘤细胞系中的所观察到的已验证表位。已知的133个表位是通过在已验证表位观察结果中用“黑色素瘤”术语过滤IEDB数据集而编译的,并且可用作验证荧光测序独特地鉴定MHC肽的限制性的基准。如图5A中所见,列表中超过四分之一的表位可使用简单的双标记物策略独特地鉴定。但是,使用简单的三标记物策略(如图5B中所示)诸如K、Y和E,超过75%的表位可分配给含有至多5个肽的荧光序列。

这些结果表明,荧光测序作为技术提供了MHC肽的可鉴定信息。当与参考数据库和多种标记策略组合时,荧光测序技术可鉴定并确认高度可能的预测肽。此外,如果有证据表明荧光序列与预测的新抗原肽匹配,则该技术也可以用于新抗原发现。这些先前已鉴定的新抗原(也称为公开新抗原)可通过荧光测序从有限的组织活检切片直接鉴定。这种类型的测试是为患者选择过程设想的。基于选择新抗原的疗法可以与表达所展示新抗原的患者配对,所展示的新抗原可通过荧光测序鉴定。

实例3–对HLA肽进行测序

(i)来自单等位基因B细胞的HLA肽

在单等位基因B细胞系上设置试行实验以获得和验证HLA肽并且预测新抗原肽。所分离的肽通过荧光测序进行测序,并将靶标肽添加到混合物中以确定检测限。

(ii)分离和验证HLA肽

两种单等位基因B细胞系(HLA-A2603和HLA B0702)购自国际组织相容性工作组,如出版物中所详述(Petersdorf等人,2013)。如所描述的培养3×10

通过LC偶联串联质谱仪(ThermoFisher,Orbitrap Fusion Lumos),使用人类蛋白质组的参考数据集(Swissprot)并且使用在文献中描述的用于分析HLA肽的设定,鉴定所分离的HLA肽(Abelin等人,2017;Bassani-Sternberg等人,2015)。通过实施对所分离的肽的基序分析和结合亲和性分析,确认了HLA分离过程的有效性(如图7中所示)。观察到的高比例的强亲和性结合肽和先前所述关于HLA等位基因的基序提供了对所分离的肽的纯度的正交确认。

(iii)从基因组信息预测HLA肽

关于B细胞系(表达HLA-A2603等位基因)的基因组和RNA测序数据是从可公开获得的数据集获得的。使用一系列软件(包括mhcflurry)分析原始序列读取并与标准参考人类基因组比较,以生成含有单核苷酸变异和indel的肽(新抗原)的列表。该方法中的下一步是通过netMHC软件分析肽序列,该软件预测肽与MHC复合体的结合亲和性并用作其在细胞上的呈递的指标。实施这一分析将转录物衍生的肽的集合缩窄至36,000。

图8中的文氏图枚举了如使用基因组信息和计算分析预测的HLA肽的列表及其与使用质谱进行的直接肽鉴定的重叠。从该分析可见,4种新抗原肽被(a)直接质谱观察到,(b)使用netMHC预测为强结合,并且(c)包含在B细胞系中特异性的突变。

(iv)HLA肽的荧光测序

为了验证HLA肽的单分子荧光测序方法,首先,如先前所述从A2603和B0702细胞系分离HLA肽。然后,使用先前所述的噁唑酮化学法,用经酸酯化的Fmoc PEG接头(Fmoc-CO-PEG4-NH2)将C末端羧酸选择性地封端(Kim等人,2011)。使用标准碳化二亚胺化学法(Totaro等人,2016),用Atto647N-胺标记内部天冬氨酸和谷氨酸残基,然后进行Fmoc基团的去保护。通过标准C-18尖端清理法去除游离染料,然后进行荧光测序。这产生了具有游离羧酸末端的经荧光标记的肽的集合。图9比较了两种细胞系之间观察到的经标记酸性残基的优势比以及与经质谱鉴定的肽的相关性。基于质谱的方法偏向可以被良好电离的肽和高峰度分子,因此可能不表明样品中存在的全部肽。使用荧光测序观察相关结构,验证了该方法能对HLA肽进行测序。

为了进一步验证荧光测序技术的灵敏度并获得其检测限,在HLA肽背景下,实施已知靶标抗原肽的加标(spike-in)和回收测定。选择先前已鉴定的新抗原(序列为ELYAEKVATR),用Atto647N荧光团标记内部酸性残基,并将稀释5个数量级的肽添加到经标记的HLA肽混合物背景中。对这一肽混合物实施荧光测序,并且每个实验对大约50,000个单独分子进行测量。将观察到具有荧光序列模式“ExxxE”的分子的数目定量,并呈现在图10.假设约1000个HLA肽/细胞的计数,荧光测序方法对于每10个细胞检测单一肽分子敏感。

(v)单分子肽测序方法在HLA肽测序中的应用

以荧光测序为示例的单分子肽测序方法可用于肿瘤治疗和监测。作为高灵敏度蛋白质组学方法的优势在于需要的样品量小并且具有用于鉴定的高动态范围。两种具体应用示出于图11.

1.新抗原或肿瘤相关抗原的治疗性发现:直接从肿瘤鉴定的HLA肽可与源自核酸测序的预测算法配对,以改进新抗原肽的证据。

2.患者筛查:可使用荧光测序平台来快速筛查患者的肿瘤活检切片中是否存在一组已知(公开)的新抗原。

***

鉴于本公开,可以在不进行过度实验的情况下进行和执行本文所公开和要求保护的所有方法。尽管已经根据优选实施例描述了本公开的组合物和方法,但是将显而易见的是,在不脱离本公开的概念、精神和范围的情况下,可以对本文所述的方法和对本文所述方法的步骤或对本文所述方法的步骤的顺序施加变化。更具体地,将显而易见的是,在化学和生理上均相关的某些药剂可以代替本文所述的药剂,同时将获得相同或相似的结果。所有此类类似的替代和修改都被认为在由所附权利要求书所限定的本公开的精神、范围和概念内。

参考文献

以下参考文献在一定程度上提供了对本文所述的那些的过程或其他细节实例的补充以引用方式明确地并入本文。

美国专利申请序列号15/461,034。

美国专利申请序列号15/510,962。

美国专利号9,625,469。

Abelin,等人Mass Spectrometry Profiling of HLA-Associated Peptidomesin Mono-allelic Cells Enables More Accurate Epitope Prediction.Immunity 46,315–326(2017)。

Backert&Kohlbacher,Genome Medicine,7(1):119,2015。

Bassani-Sternberg,等人,Mol.Cell.Proteomics.14:658–73,2015。

BCC文库-报告视图-PHM053A。可在以下网址获得:

www.bccresearch.com/market-research/pharmaceuticals/cancer-immunotherapy-phm053a.html。

Braslaysky等人,PNAS,100(7):3960-4,2003。

Brennick等人,Immunotherapy,9(4):361-71,2017。

Brown等人,Genome Res.,24:743–50,2014。

Caron等人,Immunity,47(2):203-8,2017。

Dudley&Rosenberg,Nat.Rev.Cancer,3:666–675,2003。

Edman,等人,Acta.Chem.Scand.,4:283-293,1950

Goodman等人,Molecular Cancer Therapeutics,16(11):2598-608,2017。

Harris等人,Cancer Biology&Medicine,13(2):171-93,2016。

Harris等人,Nature,552:S74,2017。

Hernandez等人,New Journal of Chemistry,41:462-469,2017。

Kim,等人,Anal.Biochem.,419:211–6,2011。

Lee等人,Trends in Immunology,39(7):536-48,2018。

Maude等人,New England Journal of Medicine,378(5):439-48,2018。

Müller等人,in Immunotherapy of Cancer,21–44Humana Press,2006。

Neefjes等人,Nat.Rev.Immunol.,11:823–836,2011。

Petersdorf等人,Int.J.Immunogenet.,40,2013。

Pham等人,Annals of Surgical Oncology,25(11):3404-12,2018。

Phatnani&Greenleaf,Genes Dev,20:2922-2936,2006。

Robbins等人,Clinical Cancer Research,21(5):1019-27,2015。

Schumacher&Schreiber,Science,348(6230):69-74,2015。

Shimabukuro-等人,Journal for Immunotherapy of Cancer,6,2018。

Stevens等人,Rapid Commun Mass Spectrom.,19:2157-2162,2005。

Swaminathan R,Biology S.Jagannath Swaminathan.Education.doi:10.1002/rcm.3179,2010。

Swaminathan,等人,bioRxiv Cold Spring Harbor Labs Journals,2014。

Totaro,K.A.等人,Bioconjug.Chem.,27:994–1004,2016。

Vitiello和Zanetti,Nature Biotechnology,35(9):815-7,2017。

Yadav等人,Nature,515:572–576,2014。

Yee&Lizee,Cancer J.,23:144–148,2017。

Yee等人,Cancer J.,21:492–500,2015。

Yewdell等人,Nat.Rev.Immunol.,3:952–961,2003。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号