首页> 中国专利> 用于鉴定肿瘤特异性抗原的基于蛋白质基因组学的方法

用于鉴定肿瘤特异性抗原的基于蛋白质基因组学的方法

摘要

由于在若干种癌症中肿瘤浸润淋巴细胞(TIL)的存在与良好的预后呈正相关,因此T细胞,尤其是CD8T细胞被认为是肿瘤根除中必不可少的参与者。为了清除肿瘤细胞,CD8T细胞识别肿瘤抗原,该肿瘤抗原是存在于肿瘤细胞表面的MHC I相关肽,在正常细胞上没有表达或表达极低。本文描述了使用来自癌症和正常匹配的mTEChi样品的RNA测序数据的蛋白质基因组学方法以便鉴定源自(i)基因组的编码和非编码区,(ii)非同义单碱基突变或短插入/删除和更复杂的重排以及(iii)内源性逆转录元件的非耐受性肿瘤特异性抗原,不管样品的突变负荷或复杂性如何,所述方法均起作用。

著录项

  • 公开/公告号CN112639136A

    专利类型发明专利

  • 公开/公告日2021-04-09

    原文格式PDF

  • 申请/专利权人 蒙特利尔大学;

    申请/专利号CN201980056943.7

  • 申请日2019-08-28

  • 分类号C12Q1/6886(20180101);C12Q1/6809(20180101);G01N33/68(20060101);G01N33/574(20060101);C40B30/00(20060101);C40B40/02(20060101);C40B40/10(20060101);C40B50/06(20060101);G16B30/10(20190101);C07K7/06(20060101);C07K14/47(20060101);C07K14/725(20060101);C07K17/04(20060101);C12N15/12(20060101);C12N5/0783(20100101);C12N5/10(20060101);A61K35/17(20150101);A61K39/00(20060101);A61P35/00(20060101);A61P35/02(20060101);A61P37/04(20060101);

  • 代理机构51258 成都超凡明远知识产权代理有限公司;

  • 代理人王晖;刘书芝

  • 地址 加拿大魁北克

  • 入库时间 2023-06-19 10:32:14

说明书

相关申请交叉引用

本申请要求提交于2018年8月30日的美国临时专利申请No.62/724,760的优先权,其全文通过援引并入本文。

技术领域

本发明总体上涉及癌症,以及更具体地涉及可用于基于T细胞的癌症免疫治疗的肿瘤抗原的鉴定。

背景技术

由于在若干种癌症中肿瘤浸润淋巴细胞(TIL)的存在与良好的预后呈正相关,因此CD8 T细胞被认为是肿瘤根除中必不可少的参与者,并且响应于免疫检查点抑制剂

正在做出相当大的努力来发现可以用于治疗性癌症疫苗的可执行的TSA。最常见的策略取决于反向免疫:i)在肿瘤细胞上进行外显子组测序以鉴定突变,以及ii)使用MHC结合预测软件工具来鉴定哪些突变的MAP可能是良好的MHC结合剂

因此,存在用于鉴定可用于基于T细胞的癌症免疫治疗的肿瘤抗原的新颖的方法的需要。

急性淋巴细胞白血病(ALL)是发生在骨髓、血液和髓外部位的淋巴样祖细胞的恶性转化和增殖。虽然80%的ALL发生在儿童身上,但如果它发生在成人身上,则表示毁灭性的疾病。在美国,ALL的发病率估计为1.6/100 000人。虽然剂量强化策略对儿科患者的结果具有显著改善,但对于老年人的预后仍然很差。尽管对诱导化疗的反应率很高,但仅30-40%的成年ALL患者实现长期缓解。

因此,存在用于治疗ALL的新颖的方法的需要。

肺癌——一种高度侵袭性、迅速转移性且流行性癌症——是美利坚合众国(USA)男性和女性两者的头号杀手癌症。约90%的肺癌病例是由吸烟和使用烟草产品引起的。然而,其他因素诸如氡气、石棉、空气污染暴露以及慢性感染可能促进肺癌变的发生。此外,肺癌易感性的多重继承和获得机制已被提出。肺癌分为生长和扩散方式不同的两个广泛的组织学类别:小细胞肺癌(SCLC)和非小细胞肺癌(NSCLC)。肺癌的治疗选择包括外科手术、放射治疗、化疗以及靶向治疗。尽管在过去的25年期间,对于肺癌的诊断和治疗有了改进,但是对于患者的预后仍然不令人满意。除了对最局部的癌症,对于当前标准治疗的反应很差。

因此,存在用于治疗肺癌的新颖的方法的需要。

本说明书涉及一些文档,将其全部内容通过援引以其整体并入本文。

发明内容

本公开提供了以下条目1至75:

1.一种用于在肿瘤细胞样品中鉴定肿瘤抗原候选物的方法,所述方法包括:

(a)通过以下产生肿瘤特异性蛋白质组数据库:(i)从肿瘤RNA序列提取包括至少33个碱基对的子序列(k-mers)集合;(ii)将(i)中的所述肿瘤子序列集合与从来自正常细胞的RNA序列提取的包括至少33个碱基对的相应的对照子序列集合比较;(iii)提取在所述相应的对照子序列中不存在的所述肿瘤子序列,从而获得肿瘤特异性子序列;以及(iv)经计算机翻译所述肿瘤特异性子序列,从而获得所述肿瘤特异性蛋白质组数据库;

(b)通过以下产生个性化肿瘤蛋白质组数据库:(i)将所述肿瘤RNA序列与参考基因组序列比较来鉴定所述肿瘤RNA序列中的单碱基突变;(ii)在所述参考基因组序列中插入在(i)中鉴定的所述单碱基突变,从而创建个性化肿瘤基因组序列;(iii)经计算机翻译来自所述个性化肿瘤基因组序列的编码表达蛋白质的转录物,从而获得所述个性化肿瘤蛋白质组数据库;

(c)将来自所述肿瘤的主要组织相容性复合体(MHC)相关肽(MAP)的序列与(a)的所述肿瘤特异性蛋白质组数据库以及(b)的所述个性化肿瘤蛋白质组数据库的序列比较以鉴定所述MAP;以及

(d)从在(c)中鉴定的MAP之中鉴定肿瘤抗原候选物,其中肿瘤抗原候选物是其序列和/或编码序列在肿瘤细胞中相对于正常细胞过表达或占比过大的肽。

2.根据条目1所述的方法,其中,上述方法进一步包括(1)从所述肿瘤细胞样品中分离主要组织相容性复合体(MHC)相关肽(MAP)并对其测序,和/或(2)对所述肿瘤细胞样品进行全转录物组测序以获得所述肿瘤RNA序列。

3.根据条目2所述的方法,其中,所述分离MAP包括(i)通过弱酸处理从所述细胞样品中释放所述MAP;以及(ii)对所述释放的MAP进行色谱。

4.根据条目3所述的方法,其中,所述方法进一步包括在所述色谱之前用尺寸排阻柱过滤所述释放的肽。

5.根据条目1至4中任一项所述的方法,其中,所述子序列包括33至54个碱基对。

6.根据条目1至5中任一项所述的方法,进一步包括将重叠的肿瘤特异性子序列组装成较长的肿瘤子序列(重叠群)。

7.根据条目6所述的方法,其中,所述尺寸排阻柱具有约3000Da的截留值。

8.根据条目1至7中任一项所述的方法,其中,所述对MAP测序包括对所述分离的MAP进行质谱(MS)测序分析。

9.根据条目1至8中任一项所述的方法,其中,所述方法进一步包括使用相应的正常细胞产生个性化正常蛋白质组数据库。

10.根据条目9所述的方法,其中,(d)中所述的鉴定包括如果在所述正常个性化蛋白质组数据库中检测到所述MAP的序列,则排除该MAP。

11.根据条目1至10中任一项所述的方法,其中,所述方法进一步包括从所述肿瘤RNA序列和从来自正常细胞的RNA序列产生24核苷酸或39核苷酸k-mer数据库以获得肿瘤k-mer数据库和正常k-mer数据库;以及将所述肿瘤k-mer数据库和正常k-mer数据库与源自所述MAP编码序列的24核苷酸或39核苷酸k-mer比较,其中,源自所述MAP编码序列的所述k-mer在所述肿瘤k-mer数据库中相对于所述正常k-mer数据库的过表达或占比过大表明了所述相应的MAP是肿瘤抗原候选物。

12.根据条目11所述的方法,其中,源自所述MAP编码序列的所述k-mer在所述肿瘤k-mer数据库中相对于所述正常k-mer数据库过表达或占比过大至少10倍。

13.根据条目11或12所述的方法,其中,所述源自所述MAP编码序列的k-mer不存在于所述正常k-mer数据库中。

14.根据条目1至13中任一项所述的方法,其中所述方法包括:

(a)在肿瘤细胞样品中分离MAP并对其测序;

(b)对所述肿瘤细胞样品进行全转录物组测序,从而获得肿瘤RNA序列;

(c)通过以下产生肿瘤特异性蛋白质组数据库:(i)从所述肿瘤RNA序列提取包括至少33个核苷酸的子序列集合;(ii)将(i)中的所述肿瘤子序列集合与从来自正常细胞的RNA序列提取的包括至少33个核苷酸的相应的对照子序列集合比较;(iii)提取在所述相应的对照子序列中不存在或至少低表达至四分之一的所述肿瘤子序列,从而获得肿瘤特异性子序列;以及(iv)经计算机翻译所述肿瘤特异性子序列,从而获得所述肿瘤特异性蛋白质组数据库;

(d)通过以下产生个性化肿瘤蛋白质组数据库:(i)将所述肿瘤RNA序列与参考基因组序列比较来鉴定所述肿瘤RNA序列中的单碱基突变;(ii)在所述参考基因组序列中插入在(i)中鉴定的所述单碱基突变,从而创建个性化肿瘤基因组序列;(iii)经计算机翻译来自所述个性化肿瘤基因组序列的编码表达蛋白质的转录物,从而获得所述个性化肿瘤蛋白质组数据库;

(e)通过以下产生个性化正常肿瘤蛋白质组数据库:(i)将来自正常细胞的RNA序列与参考基因组序列比较以鉴定所述正常RNA序列中的单碱基突变;(ii)在所述参考基因组序列中插入在(i)中鉴定的所述单碱基突变,从而创建个性化正常基因组序列;(iii)经计算机翻译来自所述个性化正常基因组序列的编码表达蛋白质的转录物,从而获得所述个性化正常蛋白质组数据库;

(f)通过(i)从所述来自正常细胞的RNA序列和所述肿瘤RNA序列提取包括至少24个核苷酸的子序列集合来产生正常和肿瘤k-mer数据库;

(g)将在(a)中获得的MAP的序列与(c)的所述肿瘤特异性蛋白质组数据库以及(d)的所述个性化肿瘤蛋白质组数据库的序列比较以鉴定所述MAP;以及

(h)从所述在(f)中鉴定的MAP之中鉴定肿瘤抗原候选物,其中肿瘤抗原候选物对应于以下的MAP:(1)其序列在所述个性化正常蛋白质组数据库中不存在;以及(2)(i)其序列在所述个性化肿瘤蛋白质组数据库中存在;和/或(ii)其编码序列在所述肿瘤k-mer数据库中相对于所述正常k-mer数据库过表达或占比过大。

15.根据条目1至14中任一项所述的方法,其中,所述方法进一步包括选择具有的长度为8至11个氨基酸的MAP。

16.根据条目1至15中任一项所述的方法,其中,所述正常细胞是胸腺细胞。

17.根据条目16所述的方法,其中,所述胸腺细胞是髓胸腺上皮细胞(mTEC)。

18.根据条目1至17中任一项所述的方法,进一步包括将所述肿瘤抗原候选物的编码序列与来自正常组织的序列比较。

19.根据条目1至18中任一项所述的方法,其中,所述MAP具有的长度为8至11个氨基酸。

20.根据条目1至19中任一项所述的方法,进一步包括评估所述肿瘤抗原候选物与MHC分子的结合。

21.根据条目20所述的方法,其中,所述结合是使用MHC结合预测算法评估的。

22.根据条目1至21中任一项所述的方法,进一步包括评估细胞群中识别所述肿瘤抗原候选物的T细胞的频率。

23.根据条目22所述的方法,其中,识别所述肿瘤抗原候选物的T细胞的频率是使用在其肽结合槽中包括所述肿瘤抗原候选物的多聚体MHC I类分子来评估的。

24.根据条目1至23中任一项所述的方法,进一步包括评估所述肿瘤抗原候选物诱导T细胞激活的能力。

25.根据条目24所述的方法,其中,所述肿瘤抗原候选物诱导T细胞激活的能力是通过测量由T细胞与在其细胞表面上具有与MHC I类分子结合的所述肿瘤抗原候选物的细胞接触而引起的细胞因子产生来评估的。

26.根据条目25所述的方法,其中,所述细胞因子产生包括干扰素-γ(IFN-γ)产生。

27.根据条目1至26中任一项所述的方法,进一步包括评估所述肿瘤抗原候选物诱导T细胞介导的肿瘤细胞杀伤和/或抑制肿瘤生长的能力。

28.肿瘤抗原肽,其通过根据条目1至27中任一项所述的方法来鉴定。

29.肿瘤抗原肽,其包括以下或由以下组成:SEQ ID NO:1-39中任一个所示的氨基酸序列之一。

30.根据条目29所述的肿瘤抗原肽,其包括以下或由以下组成:SEQ ID NO:17-39中任一个所示的氨基酸序列之一。

31.根据条目30所述的肿瘤抗原肽,其中,所述肿瘤抗原肽是白血病肿瘤抗原肽并且包括以下或由以下组成:SEQ ID NO:17-28中任一个所示的氨基酸序列之一。

32.根据条目31所述的肿瘤抗原肽,其中,所述白血病是B细胞急性淋巴细胞白血病(B-ALL)。

33.根据条目31或32所述的肿瘤抗原肽,其中,所述肿瘤抗原肽结合至HLA-A*02:01等位基因的人白细胞抗原(HLA)并且包括以下或由以下组成:SEQ ID NO:17-19、27和28中任一个所示的氨基酸序列之一。

34.根据条目31或32所述的肿瘤抗原肽,其中,所述肿瘤抗原肽结合至HLA-B*40:01等位基因的人白细胞抗原(HLA)并且包括以下或由以下组成:SEQ ID NO:20所示的氨基酸序列。

35.根据条目31或32所述的肿瘤抗原肽,其中,所述肿瘤抗原肽结合至HLA-A*11:01等位基因的人白细胞抗原(HLA)并且包括以下或由以下组成:SEQ ID NO:21-23中任一个所示的氨基酸序列之一。

36.根据条目31或32所述的肿瘤抗原肽,其中,所述肿瘤抗原肽结合至HLA-B*08:01等位基因的人白细胞抗原(HLA)并且包括以下或由以下组成:SEQ ID NO:24或25所示的氨基酸序列。

37.根据条目31或32所述的肿瘤抗原肽,其中,所述肿瘤抗原肽结合至HLA-B*07:02等位基因的人白细胞抗原(HLA)并且包括以下或由以下组成:SEQ ID NO:26所示的氨基酸序列。

38.根据条目30所述的肿瘤抗原肽,其中,所述肿瘤抗原肽是肺肿瘤抗原肽并且包括以下或由以下组成:SEQ ID NO:29-39中任一个所示的氨基酸序列之一。

39.根据条目38所述的肿瘤抗原肽,其中,所述肺肿瘤是非小细胞肺癌(NSCLC)。

40.根据条目38或39所述的肿瘤抗原肽,其中,所述肿瘤抗原肽结合至HLA-A*11:01等位基因的人白细胞抗原(HLA)并且包括以下或由以下组成:SEQ ID NO:29-35中任一个所示的氨基酸序列之一。

41.根据条目38或39所述的肿瘤抗原肽,其中,所述肿瘤抗原肽结合至HLA-B*07:02等位基因的人白细胞抗原(HLA)并且包括以下或由以下组成:SEQ ID NO:36所示的氨基酸序列。

42.根据条目38或39所述的肿瘤抗原肽,其中,所述肿瘤抗原肽结合至HLA-A*24:02等位基因的人白细胞抗原(HLA)并且包括以下或由以下组成:SEQ ID NO:38或39所示的氨基酸序列。

43.根据条目38或39所述的肿瘤抗原肽,其中,所述肿瘤抗原肽结合至HLA-C*07:01等位基因的人白细胞抗原(HLA)并且包括以下或由以下组成:SEQ ID NO:37所示的氨基酸序列。

44.根据条目29-43中任一项所述的肿瘤抗原,其源自基因组的非蛋白编码区。

45.根据条目44所述的肿瘤抗原,其中,所述基因组的所述非蛋白编码区是基因间区、内含子区、5′非翻译区(5′UTR)、3′非翻译区(3′UTR)或内源性逆转录元件(ERE)。

46.编码根据条目28-45中任一项所述的肿瘤抗原肽的核酸。

47.根据条目46所述的核酸,所述核酸是mRNA或病毒载体。

48.脂质体,包括根据条目28-45中任一项所述的肿瘤抗原肽或根据条目46或47所述的核酸。

49.组合物,包括根据条目28-45中任一项所述的肿瘤抗原肽、根据条目46或47所述的核酸或根据条目48所述的脂质体,以及药学上可接受的载体。

50.疫苗,包括根据条目28-45中任一项所述的肿瘤抗原肽、根据条目46或47所述的核酸、根据条目48所述的脂质体或根据条目49所述的组合物,以及佐剂。

51.分离的主要组织相容性复合体(MHC)I类分子,在其肽结合槽中包括根据条目28-45中任一项所述的肿瘤抗原肽。

52.根据条目51所述的分离的MHC I类分子,其为多聚体的形式。

53.根据条目52所述的分离的MHC I类分子,其中所述多聚体是四聚体。

54.分离的细胞,包括根据条目28-45中任一项所述的肿瘤抗原肽。

55.分离的细胞,在其表面表达主要组织相容性复合体(MHC)I类分子,所述主要组织相容性复合体(MHC)I类分子在其肽结合槽中包括根据条目28-45中任一项所述的肿瘤抗原肽。

56.根据条目55所述的细胞,其是抗原呈递细胞(APC)。

57.根据条目56所述的细胞,其中所述APC是树突状细胞。

58.T细胞受体(TCR),其特异性识别根据条目51-53中任一项所述的分离的MHC I类分子和/或在根据条目54-57中任一项所述的细胞的表面表达的MHC I类分子。

59.分离的CD8

60.细胞群,其包括至少0.5%的根据条目59所述的CD8

61.治疗受试者的癌症的方法,包括向所述受试者给药有效量的:(i)根据条目28-45中任一项所述的肿瘤抗原肽;(ii)根据条目46或47所述的核酸;(iii)根据条目48所述的脂质体;(iv)根据条目49所述的组合物;(v)根据条目50所述的疫苗;(vi)根据条目54-57中任一项所述的细胞;(vii)根据条目59所述的CD8

62.根据条目61所述的方法,其中,所述癌症是白血病。

63.根据条目62所述的方法,其中,所述白血病是B细胞急性淋巴细胞白血病(B-ALL)。

64.根据条目61所述的方法,其中,所述癌症是肺癌。

65.根据条目64所述的方法,其中,所述肺肿瘤是非小细胞肺癌(NSCLC)。

66.根据条目61-65中任一项所述的方法,进一步包括向所述受试者给药至少一种额外的抗肿瘤剂或治疗。

67.根据条目66所述的方法,其中,所述至少一种额外的抗肿瘤剂或治疗是化学治疗剂、免疫治疗、免疫检查点抑制剂、放射治疗或外科手术。

68.(i)根据条目28-45中任一项所述的肿瘤抗原肽;(ii)根据条目46或47所述的核酸;(iii)根据条目48所述的脂质体;(iv)根据条目49所述的组合物;(v)根据条目50所述的疫苗;(vi)根据条目54-57中任一项所述的细胞;(vii)根据条目59所述的CD8

69.(i)根据条目28-45中任一项所述的肿瘤抗原肽;(ii)根据条目46或47所述的核酸;(iii)根据条目48所述的脂质体;(iv)根据条目49所述的组合物;(v)根据条目50所述的疫苗;(vi)根据条目54-57中任一项所述的细胞;(vii)根据条目59所述的CD8

70.根据条目68或69所述的用途,其中,所述癌症是白血病。

71.根据条目70所述的用途,其中,所述白血病是B细胞急性淋巴细胞白血病(B-ALL)。

72.根据条目68或69所述的用途,其中,所述癌症是肺癌。

73.根据条目72所述的用途,其中,所述肺肿瘤是非小细胞肺癌(NSCLC)。

74.根据条目68-73中任一项所述的用途,进一步包括至少一种额外的抗肿瘤剂或治疗的使用。

75.根据条目74所述的用途,其中,所述至少一种额外的抗肿瘤剂或治疗是化学治疗剂、免疫治疗、免疫检查点抑制剂、放射治疗或外科手术。

通过参考附图阅读以下仅以举例方式给出的本发明的特定实施方式的非限制性描述,本发明的其他目的、优点和特征将变得更加明显。

附图说明

在附图中:

图1A-C示出了用于肿瘤特异性抗原(TSA)鉴定的靶向蛋白质基因组工作流程。图1A、B:详述了如何创建用于每个分析样品的经典癌症蛋白质组(图1A)以及癌症特异性蛋白质组(图1B)的原理图。图1C:然后使用这两种蛋白质组的组合(被称为全局癌症数据库)以鉴定来自两种充分表征的小鼠细胞系(即CT26和EL4)以及七种人原发样品(即四种B-ALL和三种肺肿瘤活检(n=2–4/样品))的由液相色谱-MS/MS(LC-MS/MS)测序的MAP,以及更特别地TSA。关于全局癌症数据库中的每一部分的统计数据可以参见表4a-b,同时通过k-mer剖析构建癌症特异性蛋白质组的实施细节如图7所呈现。aa:氨基酸,nts:核苷酸,th:k-mer出现时的样品特异性阈值(参见下文实施例1的k-mer过滤和癌症特异性蛋白质组的产生的部分)。

图2A-D描绘了示出大部分TSA源自非编码区的翻译的实验结果。图2A:表明TSA发现中涉及的关键验证步骤的流程图。关于每个步骤的细节在图8中找到。图2B:大部分TSA候选物源自异常表达的序列。示出了在CT26和EL4肿瘤模型中的mTSA(m)和aeTSA候选物(ae)的数目的条形图。图2C:示出了其中RNA-Seq数据可公开获得的22个组织/器官中的aeTSA候选物的MCS表达的热图(参见表5)。示出了先前报道的过表达的EL4 TAA

图3A-C为示出了针对各个TSA的免疫赋予不同程度的对抗EL4细胞的保护的图。将C57BL/6雌性

图4A-D是示出幼稚(naive)和免疫小鼠中的TSA特异性T细胞的IFN-γ分泌的频率的图。图4A:幼稚小鼠中每10

图5A-D是示出了源自EL4的TSA的高表达很重要但不足以诱导抗白血病反应的图。图5A、B:在第0天和第150天注射的EL4细胞上分别进行RNA和肽水平上的TSA表达的分析。图5A:表示EL4 RNA-Seq读段与编码五个EL4 TSA中的每一个的MCS完全重叠的数目的条形图。图5B:每个细胞的TSA拷贝数,如通过使用五个EL4 TSA的

图6A-C示出了在人原发性肿瘤中检测到的大多数TSA源自非编码区的翻译。图6A:大部分人TSA是aeTSA。示出了每个主要的分析的样品中aeTSA候选物(ae)和mTSA(m)的数目的条形图。图6B:人aeTSA候选物和TAA的外周表达。示出了27个aeTSA和24个过表达的TAA的MCS的表达的热图,其从癌症免疫肽数据库

图7A-D是用于k-mer剖析工作流程的代码的架构的示意图。关于用于从RNA-seq读段生成k-mers(图7A)、过滤k-mers(图7B)、将k-mers组装成重叠群(图7C)以及翻译重叠群(图7D)的代码的细节。

图8A-C示出了TSA验证过程。图8A:详述了成对的MAP/蛋白质的免疫原性状态的计算的示意图。FC:肿瘤/同基因的mTEC

图9A-D是示出了幼稚和预先免疫接种的小鼠中的抗原特异性CD8

图10A-D是示出了抗原特异性T细胞的频率的图。图10A:在幼稚或用相关或不相关肽免疫接种的小鼠中的抗原特异性T细胞的频率。图10B、C:在第150天再次用EL4细胞攻击的针对VTPVYQHL或TVPLNHNTL(图10B)或针对VNYLHRNV或VNYIHRNV(图10C)免疫接种的小鼠中抗原特异性CD8

图11A-C是示出了幼稚小鼠与预先免疫接种的小鼠之间的抗原特异性T细胞频率的相关性的图。在幼稚库和在免疫接种的小鼠中的抗原特异性CD8

图12A-B描绘了人TEC和mTEC转录组景观(landscape)的综述。图12A:从不相关供体中分离的人TEC(062015和102015)和mTEC(S5至S11)显示类似的转录组谱.在RNA-Seq之后,如kallisto估计的,选择在具有tpm>1的至少一个供体中表达的转录物来绘制所有一对一的散点图。斯皮尔曼等级相关系数(ρ)在每个图的左上角指明,并且黑线代表转录物的相同表达。图12B:额外的人类TEC/mTEC样品的RNA-Seq应当导致信息的微小增益。使用表达的转录物的集合(至少一个样品中tpm>1),通过使用以下函数推断通过向队列(nS,参见下文实施例1的TEC和mTEC样品中检测到的转录物的累积数部分)中添加额外的样品应当能被检测到的转录物的累积数(cT):

图13A-C是示出了用于通过FACS分选分离细胞的圈选策略的图。图13A:用于鼠mTEC

具体实施方式

本文使用的遗传学、分子生物学、生物化学和核酸的术语和符号遵循本领域的那些标准论文和文本,例如Kornberg and Baker,DNA Replication,Second Edition(W.H.Freeman&Co,New York,1992);Lehninger,Biochemistry,Sixth Edition(W.H.Freeman&Co,New York,2012);Strachan and Read,Human Molecular Genetics,fifth Edition(CRC Press,2018);Eckstein,editor,Oligonucleotides and Analogs:APractical Approach(Oxford University Press,New York,1991);等。所有术语都应当按照相关领域中规定的典型含义来理解。

冠词“一个或一种(a)”和“一个或一种(an)”在这里用来指冠词的一个或多于一个语法宾语(即至少一个)。例如,“一种元素”意指一种元素或多于一种元素。在本说明书和权利要求书中,除非上下文另有要求,“包括(comprise)”、“包括(comprises)”和“包括(comprising)”将被理解为意指包括所陈述的步骤或要素或步骤或要素的组,但不排除任何其他步骤或要素或步骤或要素的组。

除非在此另外指示,否则在此对数值范围的叙述仅意在用作分别提及落入范围内的每个单独数值的简写方法,并且每个单独数值被并入到说明书中,犹如其在此被单独叙述一样。范围内的所有值子集也被并入到说明书中,就像它们在本文被单独列举一样。

本文所述的所有方法可以任何合适的顺序进行,除非另有说明或上下文明显矛盾。

本文提供的任何和所有实例或示例性语言(例如“诸如”)的使用仅用来更好地说明本发明,而不是对本发明的范围施加限制,除非另有说明。

说明书中的任何语言都不应当被解释为表明了任何非权利要求的要素对于发明的实施是必不可少的。

在本文中,术语“约”具有一般意义。术语“约”用来表明值包括用于测定该值的设备或方法的固有误差变化或涵盖接近所述值的值,例如在所列举的值(或值的范围)的10%或5%内。

正在做出相当大的努力来发现可以用于治疗性癌症疫苗的可执行的TSA。最常见的策略取决于反向免疫:i)在肿瘤细胞上进行外显子组测序以鉴定突变,以及ii)使用MHC结合预测软件工具来鉴定哪些突变的MAP可能是良好的MHC结合剂

在本文所述的研究中,本发明者已经开发了能够鉴定非耐受性TSA的蛋白质基因组学工作流程,无论它们源自编码区还是非编码区,是简单重排还是复杂重排或仅仅是癌症限制的ERE。为了鉴定非耐受性序列(而不是尝试绘制所有的RNA序列读段)并重建其中的潜在突变,正确的正常匹配的信号(即mTEC

在一方面,本发明提供了一种用于在肿瘤细胞样品中鉴定肿瘤抗原候选物的方法,所述方法包括:

(a)通过以下产生肿瘤特异性蛋白质组数据库:

(i)从肿瘤RNA序列(例如,通过肿瘤细胞样品的全转录物组测序获得的RNA序列)提取包括至少33个碱基对的子序列集合(k-mers);

(ii)将(i)中的所述肿瘤子序列集合与从来自正常细胞的RNA序列提取的包括至少33个碱基对的相应的对照子序列集合比较;

(iii)提取在所述相应的对照子序列中不存在或至少低表达至四分之一的所述肿瘤子序列,从而获得肿瘤特异性子序列;以及

(iv)经计算机翻译所述肿瘤特异性子序列,从而获得所述肿瘤特异性蛋白质组数据库;

(b)通过以下产生个性化肿瘤蛋白质组数据库:

(i)将所述肿瘤RNA序列与参考基因组序列比较来鉴定所述肿瘤RNA序列中的单碱基突变;

(ii)在所述参考基因组序列中插入在(i)中鉴定的所述单碱基突变,从而创建个性化基因组序列;

(iii)经计算机翻译来自所述个性化基因组序列的编码表达蛋白质的转录物,从而获得所述个性化蛋白质组数据库;

(c)将来自所述肿瘤的主要组织相容性复合体(MHC)相关肽(MAP)的序列与(a)的所述肿瘤特异性蛋白质组数据库以及(b)的所述个性化肿瘤蛋白质组数据库的序列比较以鉴定所述MAP;以及

(d)从在(c)中鉴定的MAP之中鉴定肿瘤抗原候选物,其中肿瘤抗原候选物是其序列和/或编码序列在肿瘤细胞中相对于正常细胞过表达的肽。

在实施方式中,上述方法进一步包括从所述肿瘤细胞样品中分离主要组织相容性复合体(MHC)相关肽(MAP)并对其测序。

在实施方式中,上述方法进一步包括对所述肿瘤细胞样品进行全转录物组测序,从而获得所述肿瘤RNA序列。

如本文所用,术语“肿瘤抗原候选物”是指与主要组织相容性分子(MHC)结合且仅存在于肿瘤细胞表面或以相对于非肿瘤细胞的显著更高的水平/频率(至少2倍,优选地至少4、5或10倍)存在于肿瘤细胞表面的肽。可以靶向这样的肿瘤抗原候选物以诱导针对在其表面表达抗原的肿瘤细胞的T细胞应答。

用于从细胞样品中分离MHC相关肽(MAP)的方法是本领域所熟知的。最常用的技术是从活细胞中洗脱MHC相关肽的弱酸洗脱(MAE),如Fortier et al.(J.Exp.Med.205(3):595-610,2008)所描述的。另一种技术是肽-MHC I类复合体的免疫沉淀或亲和纯化,紧接着是肽洗脱(参见例如,Gebreselassie et al.,Hum Immunol.2006November;67(11):894-906)。基于后者的两种高通量策略已被实现。第一种是基于具有编码可溶性分泌MHC(缺乏功能性跨膜结构域)的表达载体的细胞系的转染以及与分泌的MHC相关的肽的洗脱(Barneaet al.,Eur J Immunol.2002Jan;32(1):213-22;and Hickman HD et al.,JImmunol.2004Mar 1;172(5):2944-52)。第二种方法依赖于化学或代谢标记以提供MHC相关肽的定量谱(Weinzierl AO et al.,Mol Cell Proteomics.2007Jan;6(1):102-13.Epub2006Oct 29;Lemmel C et al.,Nat Biotechnol.2004Apr;22(4):450-4.Epub 2004Mar 7;Milner E,Mol Cell Proteomics.2006Feb;5(2):357-65.Epub 2005Nov 4)。

在进一步分析之前,洗脱后的MAP可以经受任何纯化/富集步骤,包括尺寸排阻色谱或超滤(使用具有的截留值为约5000Da,例如约3000Da的过滤器)、反相色谱(疏水色谱)和/或离子交换色谱(例如,阳离子交换色谱)。洗脱后的MAP的序列可以使用本领域已知的任何肽/蛋白测序方法,诸如质谱(串联质谱或MS/MS,如下文所述)和埃德曼降解反应(Edman degradation reaction)来测定。

全转录物组测序(也称为“总RNA测序”、“RNA测序”或RNA-seq)是指对样品中(肿瘤样品,正常细胞样品)所有RNA,包括编码RNA以及多种形式的非编码RNA,诸如miRNA、snRNA和tRNA进行测序。全转录物组测序的方法,例如下一代测序(NGS)技术是本领域所熟知的。可商业获得的(例如来自Illumina(NextSeq

优选地,RNA制剂作为用于NGS的起始材料。这样的核酸很容易地从样品,诸如生物材料,例如,从新鲜、快速冷冻或福尔马林固定的石蜡包埋肿瘤组织或从新鲜分离的细胞或从存在于患者外周血中的循环肿瘤细胞(CTC)中获得。正常或对照RNA可以从正常、体细胞或生殖细胞中提取。来自正常细胞的RNA序列可以对应于不同类型的正常细胞,例如,来自不同组织的正常细胞的RNA序列集。来自正常细胞的RNA序列也可以从胸腺细胞,优选地髓胸腺上皮细胞(mTEC)诸如MHC II

本文所述方法包括使用无比对RNA-seq分析工作流程,称作k-mer剖析,产生肿瘤特异性蛋白质组数据库,其包括源自结构变体(包括大插入或缺失(InDels)或融合的任何类型的突变)以及非编码区的翻译的序列。肿瘤和正常RNA序列(RNA-seq读段)被“切碎”或“分割”成k-mer,即长度为k且k≥33个核苷酸的子序列。因为结合至MHC I类分子(MAP)的肽通常不多于11个氨基酸长度(以及因此由33个核苷酸长度的序列编码),将RNA序列分割成至少33个核苷酸的子序列最小化丢失潜在的MAP的风险。本领域技术人员将会理解为了最小化肿瘤特异性蛋白质组数据库的大小,将RNA序列分割成33个核苷酸的子序列(即k=33个核苷酸)对于鉴定MHC I类限制性肿瘤抗原是优选的。本领域技术人员也将会理解为了鉴定MHC II类限制性肿瘤抗原,最小的k-mer长度应当从33增加至54个核苷酸(k≥54个核苷酸),MHC II类相关肽长度范围通常为从13至18个氨基酸。然后将肿瘤子序列与相应的对照子序列集合(来自正常细胞的RNA序列)比较,以提取在相应的对照子序列中不存在或至少低表达至四分之一(优选地至少低表达至五分之一、六分之一、七分之一、八分之一、九分之一或十分之一)的肿瘤子序列。在实施方式中,为了最小化k-mer空间固有的冗余,所述方法进一步包括将重叠的肿瘤特异性子序列组装成较长的肿瘤子序列(典型地称为重叠群)。然后将肿瘤特异性子序列或重叠群经计算机翻译(例如,翻译成3框或6框,取决于子序列或重叠群是源自编码链还是非编码链)以获得肿瘤特异性蛋白质组数据库。在实施方式中,从所述肿瘤特异性蛋白质组数据库中移出少于8个氨基酸(MHC I类肽的最小长度)或13个氨基酸(MHC II类肽的最小长度)的蛋白质片段。

在实施方式中,所述方法进一步包括从RNA序列(来自正常和肿瘤细胞)产生k=24个核苷酸(对于MHC I类肽)或k=39个核苷酸(对于MHC II类肽)的k-mer数据库以获得癌症/肿瘤和正常24(或39)个核苷酸长度的k-mer数据库。这些数据库可以用于与MAP编码序列(MCS)比较,以确定肿瘤细胞中MCS是否过表达或占比过大,如下文所述的。

方法也包括产生个性化肿瘤蛋白质组数据库。为此,将肿瘤RNA序列(肿瘤RNA-seq读段)与参考基因组序列比较以鉴定肿瘤RNA序列中的单碱基突变。然后将这些突变插入至参考基因组中,以获得个性化肿瘤基因组,从中可以获得包含所有表达的蛋白质编码转录物序列的经典翻译产物序列的相应的个性化肿瘤蛋白质组数据库。允许鉴定WT MAP和由外显子组的经典框编码的突变TSA(新抗原)的个性化肿瘤蛋白质组数据库的产生也通过不将数据库过度偏向于肿瘤特异性序列来提高用于MS分析的数据库的可靠性,这种偏向将导致几种假阳性的鉴定。

在实施方式中,方法也包括产生个性化正常蛋白质组数据库。为此,将来自正常细胞的RNA序列(正常RNA-seq读段)与参考基因组序列比较以鉴定正常RNA序列中的单碱基突变。然后将这些突变插入至参考基因组中,以获得个性化正常基因组,从中可以获得包含所有表达的蛋白质编码转录物序列的经典翻译产物序列的相应的个性化正常蛋白质组数据库。这种个性化正常蛋白质组数据库可以被用来过滤在正常(非肿瘤)细胞中表达的MAP,这些MAP不是合适的TSA候选物。

如本文所用,术语“参考基因组”是指文献中报道的人基因组组装,并且包括例如Genome Reference Consortium Human Build 38(GRCh38,RefSeq:accession No.GCF_000001405.37),Hs_Celera_WGSA(Celera Genomics;Istrail S.et al.,Proc Natl AcadSci USA.2004;101(7):1916-21).Epub 2004Feb 9)、HuRef and HuRefPrime(J.CraigVenter Institute;Levy S,et al.PLoS Biology.2007;5:2113-2144)、YH1 and BGIAF(Beijing Genomics Institute;Li R,et al.Genome Research.2010;20:265-272),HsapALLPATHS1(Broad Institute)等。参考人基因组组装的列表可以在国家生物技术信息中心(NCBI)的“组装”数据库中找到。在实施方式中,参考基因组是GRCh38。

然后将在方法的步骤(a)中得到的MAP的序列与肿瘤特异性蛋白质组数据库以及允许MAP鉴定的个性化肿瘤蛋白质组数据库比较(例如,blast比对)。

可以在以上鉴定的MAP中鉴定出肿瘤抗原候选物。这样的肿瘤抗原候选物对应于其序列和/或编码序列在肿瘤细胞中相对于正常细胞过表达的多肽。

在实施方式中,方法进一步包括消除或丢弃其序列在正常的个性化蛋白质组数据库中检测到的MAP。

在实施方式中,方法包括检索已鉴定的MAP的编码序列,即MAP编码序列(MCS)。在其他实施方式中,方法包括将MCS转化为24个(对于MHC I类肽)或39个(对于MHC II类肽)核苷酸的k-mer集合。在其他实施方式中,将源自MCS的这些k-mer集合与癌症/肿瘤和正常24(或39)个核苷酸k-mer数据库比较。

在实施方式中,方法包括:

(a)从肿瘤细胞样品中分离主要组织相容性复合体(MHC)相关肽(MAP)并对其测序;

(b)对所述肿瘤细胞样品进行全转录物组测序,从而获得肿瘤RNA序列;

(c)通过以下产生肿瘤特异性蛋白质组数据库:

(i)从所述肿瘤RNA序列提取包括至少33个核苷酸的子序列(k-mers)集合;

(ii)将(i)中的所述肿瘤子序列集合与从来自正常细胞的RNA序列提取的包括至少33个核苷酸的相应的对照子序列集合比较;

(iii)提取在所述相应的对照子序列中不存在或至少低表达至四分之一的所述肿瘤子序列,从而获得肿瘤特异性子序列;以及

(iv)经计算机翻译所述肿瘤特异性子序列,从而获得所述肿瘤特异性蛋白质组数据库;

(d)通过以下产生个性化肿瘤蛋白质组数据库:

(i)将所述肿瘤RNA序列与参考基因组序列比较来鉴定所述肿瘤RNA序列中的单碱基突变;

(ii)在所述参考基因组序列中插入在(i)中鉴定的所述单碱基突变,从而创建个性化肿瘤基因组序列;

(iii)经计算机翻译来自所述个性化肿瘤基因组序列的编码表达蛋白质的转录物,从而获得所述个性化肿瘤蛋白质组数据库;

(e)通过以下产生个性化正常肿瘤蛋白质组数据库:

(i)将来自正常细胞的RNA序列与参考基因组序列比较以鉴定所述正常RNA序列中的单碱基突变;

(ii)在所述参考基因组序列中插入在(i)中鉴定的所述单碱基突变,从而创建个性化正常基因组序列;

(iii)经计算机翻译来自所述个性化正常基因组序列的编码表达蛋白质的转录物,从而获得所述个性化正常蛋白质组数据库;

(f)通过(i)从所述来自正常细胞的RNA序列和所述肿瘤RNA序列提取包括至少24个核苷酸的子序列集合来产生正常和肿瘤k-mer数据库;

(g)将在(a)中获得的MAP的序列与(c)的所述肿瘤特异性蛋白质组数据库以及(d)的所述个性化肿瘤蛋白质组数据库的序列比较以鉴定所述MAP;以及

(h)从所述在(f)中鉴定的MAP之中鉴定肿瘤抗原候选物,其中肿瘤抗原候选物对应于以下的MAP:(1)其序列在所述个性化正常蛋白质组数据库中不存在;以及(2)(i)其序列在所述个性化肿瘤蛋白质组数据库中存在;和/或(i)其编码序列在所述肿瘤k-mer数据库中相对于所述正常k-mer数据库过表达或占比过大。

在实施方式中,将编码序列转化成源自MAP的k-mer集合(例如,24nt的k-mer),以及确定源自MAP的k-mer在肿瘤和正常k-mer数据库中的表达或占比。如本文所用,过表达或占比过大意指该序列以相对于正常k-mer数据库的至少2倍、优选地至少3、4、或5倍以及更有选地至少10倍的水平存在于肿瘤k-mer数据库中。在实施方式中,编码序列或源自MAP的k-mer在正常的k-mer数据库中是不存在的。

在实施方式中,参考图7A,TSA候选物的鉴定和验证如下实现:在相关癌症和正常个性化蛋白质组或癌症和正常24个核苷酸长度k-mer数据库中查询每个MAP及其相关的一个或多个MAP编码序列(MCS)。在正常个性化蛋白质组中检测到的MAP被排除在外。只在癌症个性化蛋白质组和/或癌症k-mer数据库中存在的MAP被鉴定/选择作为TSA候选物。对于在这两种个性化蛋白质组中不存在的但在两种k-mer数据库中都存在的MAP,如果它们在癌症细胞中相对于正常细胞过表达(例如,至少2倍、优选地至少5倍以及更优选地至少10倍),则它们被选择。如果MAP由若干种MCS编码,如果它们各自的MCS是一致的,即如果其被一致地标记为TSA候选物,则将其鉴定/选择为TSA候选物。在实施方式中,具有I/L变体的TSA候选物由于它们难以被MS区分,因此被排除在TSA候选物之外。

在实施方式中,在比较之前,将洗脱后的MAP过滤以选择8至11个氨基酸长度的肽。在其他实施方式中,在比较之前,将洗脱后的MAP过滤以选择至少一个相关的MHC I类分子的百分等级≤2%的那些,如NetMHC software version 4.0预测的(

在实施方式中,方法进一步包括将肿瘤抗原候选物的编码序列与正常组织的序列比较。在实施方式中,使用至少5、10、15、20或25种不同组织的序列。来自正常组织的序列可以从公共数据库诸如Expression Atlas(Petryszak et al.,Nucleic Acids Research,Volume 44,Issue D1,4January 2016,Pages D746-D752)、scRNASeqDB(Cao Y,et al.(2017).Genes 8(12),368)、RNA-Seq Atlas(Krupp et al.,Bioinformatics,Volume 28,Issue 8,15April 2012,Pages 1184-1185)和Encode获得或者可以对正常组织进行RNA-seq来产生。在实施方式中,如果(1)其编码序列在任何正常组织中都不表达,或者如果它只在MHC I类阴性组织中表达或(2)其编码序列在评估的MHC I类阳性组织中表达小于50%,优选地小于45%、40%、35%或30%,则所述方法进一步包括选择肿瘤抗原候选物。在实施方式中,如果肿瘤抗原候选物的编码序列在少于7个,优选地少于6个、5个、4个或3个的评估的正常组织中表达,则所述肿瘤抗原候选物被选择。

在实施方式中,方法进一步包括确定TSA候选物的基因编码序列的基因组位置,以及如果(1)编码序列匹配至一致的基因组位置;(2)编码序列不匹配至高可变区(诸如TCR基因的Ig,H2)或者至多个基因以及(3)没有重叠同义突变,则包括选择TSA候选物。可以使用来自UCSC Genome Browser的BLAT工具来进行这样的测定(Kent WJ.Genome Res.2002Apr;12(4):656-64)和/或the Integrative genomics viewer(IGV)tool(Robinson et al.,Nat Biotechnol.2011Jan;29(1):24-6)。

在实施方式中,方法进一步包括测定和预测肿瘤抗原候选物(TSA候选物)与MHC I类分子的结合。这种结合可能是肽与等位产物的预测的结合亲和性(IC

也可以根据其抑制放射性标记探针肽与MHC分子结合的能力评估感兴趣的肽(例如,TSA候选物)与MHC的结合。MHC分子用表面活性剂增溶并用亲和色谱法纯化。然后在蛋白酶抑制剂混合物(cocktail)的存在下,将它们与感兴趣的肽(例如,TSA候选物)以及过量的放射性标记探针肽在室温下孵育2天。在孵育期结束时,通过尺寸排阻凝胶过滤色谱将MHC肽复合体与未结合的放射性标记肽分离,并确定结合放射性的百分数。特定肽对MHC分子的结合亲和性可以通过各种剂量的未标记的竞争肽与MHC分子以及标记的探针肽共孵育来确定。抑制50%的标记肽的结合所需的未标记肽的浓度(IC

鉴定的TSA候选物与MHC I类分子的结合也可以使用T细胞表位发现系统/工具,诸如ProImmune

在实施方式中,方法进一步包括评估细胞群,例如,来自受试者的细胞样品(例如,PBMC)中,识别肿瘤抗原候选物的T细胞的数目或频率。识别给定抗原的T细胞的数量或频率可以使用本领域熟知的各种方法评估,例如通过将细胞群与在肽结合槽中包括所述肿瘤抗原候选物的多聚体MHC I类分子(例如,MHC四聚体)接触,并确定用多聚体MHC I类分子标记的细胞的数目。多聚体MHC I类分子可以用荧光团可检测地标记(直接标记),或用已标记的配体识别的部分来标记(间接或次级标记)。替代地,识别TSA候选物的T细胞的数目或频率可以通过在用于激活T细胞的合适的条件下,在TSA候选物的存在下确定激活的T细胞的数目/频率来评估。激活的T细胞的数目/频率可以通过检测分泌由T细胞激活所诱导的细胞因子,例如,IFN-γ或IL-2的细胞来评估(例如,通过ELISpot或流式细胞术)。

在实施方式中,方法进一步包括评估肿瘤抗原候选物诱导T细胞激活的能力,例如,通过将T细胞群与具有在它们的细胞表面处与MHC I类分子结合的肿瘤抗原候选物的细胞(例如,APC,诸如树突状细胞)接触,并测量T细胞激活的至少一个参数,诸如增殖、细胞因子/趋化因子产生(例如,IFN-γ或IL-2产生)、细胞毒性杀伤等。

在实施方式中,所述方法进一步包括评估肿瘤抗原候选物诱导T细胞介导的肿瘤细胞杀伤和/或抑制肿瘤生长的能力。这可以使用肿瘤细胞在体外实现,也可以使用合适的动物模型在体内实现。

在实施方式中,肿瘤抗原候选物具有的长度为约7至20个氨基酸,以及更特别地约8至18个氨基酸,优选地长度为8至11(对于MHC I类肿瘤抗原)或13至18(对于MHC II类肿瘤抗原)个氨基酸。

本文所述方法可用于通过对感兴趣的肿瘤/癌细胞样品进行全转录物组测序来鉴定任何类型癌症的肿瘤抗原候选物。这样的癌症的实例包括但不限于癌、淋巴瘤、母细胞瘤、肉瘤、以及白血病,以及更特别地骨癌、血液/淋巴癌诸如白血病(AML、CML、ALL)、骨髓瘤、淋巴瘤、肺癌、肝癌、胰腺癌、皮肤癌、头或颈癌、皮肤或眼内黑色素瘤、子宫癌、卵巢癌、直肠癌、肛区癌、胃癌、结肠癌、乳腺癌、前列腺癌、子宫癌、性器官和生殖器官癌、食管癌、小肠癌、内分泌系统癌、甲状腺癌、甲状旁腺癌、肾上腺癌、软组织肉瘤、膀胱癌、肾癌、肾细胞癌、肾盂癌、中枢神经系统(CNS)肿瘤、神经外胚层癌、脊髓轴肿瘤、胶质瘤、脑膜瘤、以及垂体腺瘤。因此,在实施方式中,本文所述的方法的步骤(a)中使用的肿瘤细胞样品是包括上述癌症中的任何一种的细胞的样品。

在其他方面,本公开涉及本文鉴定的肿瘤抗原肽(或肿瘤特异性肽),即,包括表1a、1b、2a-2d或3a-3c(SEQ ID NO:1-39),优选地表2a-2d或3a-3c(SEQ ID NO:17-39)公开的氨基酸序列或其相对于SEQ ID NO:1-39的序列具有一个或多个突变的变体中的一种。

通常,在HLA I类的情况下存在的肽,诸如肿瘤抗原肽的长度在约7或8至约15个,或优选地在8至14个氨基酸残基之间变化。在本公开所述的方法的一些实施方式中,将包括本文定义的肿瘤抗原肽序列的较长的肽人工负载至细胞诸如抗原呈递细胞(APC),由细胞加工,并且肿瘤抗原肽通过MHC I类分子呈递在APC表面。在这种方法中,长于15个氨基酸残基的肽/多肽(即,肿瘤抗原前体肽)可以被负载至APC,由在APC细胞质中的蛋白酶加工,从而提供了本文定义的相应的肿瘤抗原肽,用于呈递。在一些实施方式中,用于产生本文定义的肿瘤抗原肽的前体肽/多肽,是例如1000、500、400、300、200、150、100、75、50、45、40、35、30、25、20或15个氨基酸或更少。因此,本文所述的所有使用肿瘤抗原肽的方法和工艺包括使用较长的肽或多肽(包括天然蛋白),即肿瘤抗原前体肽/多肽,以诱导由细胞(APC)加工以后的“最终”8-14肿瘤抗原肽的呈递。在一些实施方式中,本文所提及的肿瘤抗原肽的长度是约8至14、8至13、或8至12个氨基酸长度(例如长度为8、9、10、11、12或13个氨基酸),足够小以用于直接配合HLA I类分子。在实施方式中,肿瘤抗原肽包括20个氨基酸或更少,优选地15个氨基酸或更少,更优选地14个氨基酸或更少。在实施方式中,抗原肿瘤肽包括至少7个氨基酸,优选地至少8个氨基酸,更优选地至少9个氨基酸。

如本文所用,术语“氨基酸”包括天然存在的氨基酸以及用于多肽化学以制备肿瘤抗原肽的合成类似物的其他氨基酸(例如,天然存在的氨基酸、非天然存在的氨基酸、非核酸序列编码的氨基酸等)的L-和D-异构体。天然存在的氨基酸的实例是甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、苏氨酸等。其他氨基酸包括例如氨基酸的非遗传编码形式,以及L-氨基酸的保守性替换。天然存在的非遗传编码的氨基酸包括,例如,β-丙氨酸、3-氨基-丙酸、2,3-二氨基丙酸、α-氨基异丁酸(Aib)、4-氨基-丁酸、N-甲基甘氨酸(肌氨酸)、羟脯氨酸、鸟氨酸(例如,L-鸟氨酸)、瓜氨酸、叔丁基丙氨酸、叔丁基甘氨酸、N-甲基异亮氨酸、苯甘氨酸、环己基丙氨酸、正亮氨酸(Nle)、正缬氨酸、2-萘基丙氨酸、吡啶基丙氨酸、3-苯并噻吩基丙氨酸、4-氯苯基丙氨酸、2-氟苯基丙氨酸、3-氟苯基丙氨酸、4-氟苯基丙氨酸、青霉胺、1,2,3,4-四氢-异喹啉-3-羧酸、β-2-噻吩基丙氨酸、甲硫氨酸亚砜、L-高精氨酸(Hoarg)、N-乙酰基赖氨酸、2-氨基丁酸、2-氨基丁酸、2,4,-二氨基丁酸(D-或L-)、对氨基苯丙氨酸、N-甲基缬氨酸、高半胱氨酸、高丝氨酸(HoSer)、磺基丙氨酸、ε-氨基己酸、δ-氨基缬草酸或2,3-二氨基丁酸(D-或L-)等。这些氨基酸在生物化学/肽化学领域中是熟知的。在实施方式中,肿瘤抗原肽只包括天然存在的氨基酸。

在实施方式中,本文所述的肿瘤抗原肽包括具有相对于本文提及的序列包含功能等效的氨基酸残基替换的改变的序列的变体肽。例如,序列中的一种或多种氨基酸残基可以被充当功能等效物的极性相似(具有相似的物理化学性质)的另一种氨基酸置换,导致沉默改变(silent alteration)。序列中的氨基酸的置换可以选自氨基酸所属类别的其他成员。例如,带正电荷(碱性)的氨基酸包括精氨酸、赖氨酸和组氨酸(以及高精氨酸和鸟氨酸)。非极性(疏水)的氨基酸包括亮氨酸、异亮氨酸、丙氨酸、苯丙氨酸、缬氨酸、脯氨酸、色氨酸和甲硫氨酸。不带电极性的氨基酸包括丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺。带负电荷(酸性)的氨基酸包括谷氨酸和天冬氨酸。氨基酸甘氨酸可以包括在非极性氨基酸家族或不带电(中性)极性的氨基酸家族。在氨基酸家族内所做的置换通常被理解为保守置换。本文所提及的肿瘤抗原肽可以包括所有的L-氨基酸、所有的D-氨基酸或者L-和D-氨基酸的混合物。在实施方式中,本文所提及的肿瘤抗原肽包括所有的L-氨基酸。

在实施方式中,在包括SEQ ID NO:1-39中所示的序列之一的肿瘤抗原肽的序列中,对与T细胞受体的相互作用没有实质地贡献的氨基酸残基可以被其掺入不会实质地影响T细胞的反应性,也不会消除与相关MHC分子的结合的其他氨基酸替换来修饰。在实施方式中,将肿瘤抗原肽进行变体序列优化以提高MHC结合,即包括一种或多种突变(例如,1、2或3种突变),例如,增强与MHC分子的结合的氨基酸置换。肿瘤抗原肽变体的结合亲和力可以,例如,使用MHC结合预测工具诸如NetMHC4.0;NetMHCpan4.0;以及MHCflurry 1.2.0来评估。可以考虑序列优化的肿瘤抗原肽变体,例如,如果预测序列优化的肿瘤抗原肽变体与特定的HLA的亲和结合力相比天然的肿瘤抗原肽是等效的、或优选地更强。然后可以使用本领域熟知的方法,例如使用Prolmmune's REVEAL测定法筛选选择的序列优化的目标肽与特定的HLA体外结合。

也可以将肿瘤抗原肽N-和/或C末端加盖或修饰来防止降解、提高稳定性、亲和性和/或吸收、以及因此本公开提供的肿瘤抗原肽的变体具有式Z

在实施方式中,本公开提供了结合至HLA-A2等位基因,优选地HLA-A*02:01等位基因的HLA分子的肿瘤抗原肽,并且包括以下或由以下组成:SEQ ID NO:17-19、27和28中任一序列所示的氨基酸序列之一。

在实施方式中,本公开提供了结合至HLA-B40等位基因,优选地HLA-B*40:01等位基因的HLA分子的肿瘤抗原肽,并且包括以下或由以下组成:SEQ ID NO:20:所示的氨基酸序列。

在实施方式中,本公开提供了结合至HLA-A11等位基因,优选地HLA-A*11:01等位基因的HLA分子的肿瘤抗原肽,并且包括以下或由以下组成:SEQ ID NO:21-23、29-35中任一序列所示的氨基酸序列之一。

在实施方式中,本公开提供了结合至HLA-B08等位基因,优选地HLA-B*08:01等位基因的HLA分子的肿瘤抗原肽,并且包括以下或由以下组成:SEQ ID NO:24或25中所示的氨基酸序列。

在实施方式中,本公开提供了结合至HLA-B07等位基因,优选地HLA-B*07:02等位基因的HLA分子的肿瘤抗原肽,并且包括以下或由以下组成:SEQ ID NO:26或36所示的氨基酸序列。

在实施方式中,本公开提供了结合至HLA-A24等位基因,优选地HLA-A*24:02等位基因的HLA分子的肿瘤抗原肽,并且包括以下或由以下组成:SEQ ID NO:38或39所示的氨基酸序列。

在实施方式中,本公开提供了结合至HLA-C07等位基因,优选地HLA-C*07:01等位基因的HLA分子的肿瘤抗原肽,并且包括以下或由以下组成:SEQ ID NO:37所示的氨基酸序列。

在实施方式中,肿瘤抗原肽是白血病肿瘤抗原肽,并且包括以下或由以下组成:SEQ ID No:17-28任一个所示的氨基酸序列之一。

在实施方式中,肿瘤抗原肽是肺肿瘤抗原肽,并且包括以下或由以下组成:SEQ IDNo:29-39中的任一个所示的氨基酸序列之一。

在实施方式中,肿瘤抗原肽是由位于基因组非编码区的序列编码的。在实施方式中,肿瘤抗原肽是由位于非翻译的转录区即3'-UTR或5'-UTR区的序列编码的。在其他实施方式中,肿瘤抗原肽是由位于内含子的序列编码的。在其他实施方式中,肿瘤抗原肽是由位于基因间区的序列编码的。在实施方式中,肿瘤抗原肽是由位于内源性逆转录元件(ERE)的序列编码的。在其他实施方式中,肿瘤抗原肽是由位于外显子且源于移码的序列编码的。

本公开的肿瘤抗原肽可以通过在包括核酸编码肿瘤抗原肽的宿主细胞中的表达(重组表达)或通过化学合成(例如,固相肽合成)产生的。肽可以很容易地通过本领域熟知的人工和/或自动化的固相肽程序合成。例如,可以通过利用“T-boc”或“Fmoc”程序进行合适的合成。用于固相合成的技术和程序已描述于例如Solid Phase Peptide Synthesis:APractical Approach,by E.Atherton and R.C.Sheppard,published by IRL,OxfordUniversity Press,1989。替代地肿瘤抗原肽可以通过段缩合的方法来制备,如例如在Liuet al.,Tetrahedron Lett.37:933-936,1996;Baca et al.,J.Am.Chem.Soc.117:1881-1887,1995;Tam et al.,Int.J.Peptide Protein Res.45:209-216,1995;Schnolzer andKent,Science 256:221-225,1992;Liu and Tam,J.Am.Chem.Soc.116:4149-4153,1994;Liu and Tam,Proc.Natl.Acad.Sci.USA 91:6584-6588,1994;以及Yamashiro and Li,Int.J.Peptide Protein Res.31:322-334,1988)中描述用于合成肿瘤抗原肽的其他方法在Nakagawa et al.,J.Am.Chem.Soc.107:7087-7092,1985中描述。在实施方式中,肿瘤抗原肽是化学合成的(合成肽)。本公开的其他实施方式涉及非天然存在的肽,其中所述肽包含以下或由以下组成:本质上由本文定义的氨基酸序列;并且已被合成生产(例如,合成的)为药物上可接受的盐。根据本公开的肿瘤抗原肽的盐与它们在体内的一种或多种状态下的肽实质上不同,因为其在体内生成的肽是无盐的。肽的非天然的盐形式可以调整肽的溶解度,特别是在包括肽的药物组合物的背景下,例如,如本文所述的肽疫苗。优选地,该盐是肽的药学上可接受的盐。

在实施方式中,本文提及的肿瘤抗原肽是实质上纯的。当化合物与天然伴随它的成分分离时,它是“实质上纯”的。典型地,当按重量计,样品中全部材料的的至少60%,更通常地75%、80%或85%,优选地超过90%以及更优选地超过95%是该化合物时,化合物是实质上纯的。因此,例如,用化学方法合成或通过重组技术生产的多肽将通常地实质上不含其天然相关的组分,例如,其来源大分子的组分。当核酸分子不直接与通常从核酸衍生的有机体的天然存在的基因组中相邻接的编码序列相邻接(即,共价连接)时,核酸分子是实质上纯的。实质上纯的化合物可以例如通过从天然资源提取、通过编码肽化合物的重组核酸分子的表达或者通过化学合成获得。纯度可以使用任何适当的方法,诸如柱色谱法、凝胶电泳、HPLC等来测量。在实施方式中,肿瘤抗原肽为溶液形式。在其他实施方式中,肿瘤抗原肽以固态形式例如,冻干的。

在其他方面,本公开进一步提供了编码本文所提及的肿瘤抗原肽或肿瘤抗原前体肽的核酸(分离的)。在实施方式中,核酸包括约21个核苷酸至约45个核苷酸、约24个至约45个氨基酸,例如24、27、30、33、36、39、42或45个核苷酸。如本文所用,“分离的”是指与存在于肽或核酸分子或天然存在的来源大分子(例如,包括其他核酸、蛋白质、脂类、糖等)的天然环境中的其他成分分离的肽或核酸分子。如本文所用,“合成的”是指不是从它的天然来源中分离出的肽或核酸分子,例如,它是通过重组技术或使用化学合成产生的。本公开的核酸可以用于本公开的肿瘤抗原肽的重组表达,并且可以被包括在载体或质粒,诸如可以被转染进入宿主细胞的克隆载体或者表达载体中。在实施方式中,本公开提供了包括编码本公开的肿瘤抗原肽的核酸序列的克隆或表达载体或质粒。替代地,编码本公开的肿瘤抗原肽的核酸可以被并入宿主细胞的基因组中。在任一情况下,宿主细胞表达由核酸编码的肿瘤抗原肽或蛋白质。如本文所用,“宿主细胞”不仅是指特定的受体细胞,而且也指这样的细胞的后代或潜在后代。宿主细胞可以是能够表达本文所述的肿瘤抗原肽的任何原核细胞(例如,大肠杆菌(E.coli))或真核细胞(例如,昆虫细胞、酵母或哺乳动物细胞)。载体或质粒包含用于插入的编码序列的转录和翻译的所需的元件,并且可以包含其他元件诸如抗性基因、克隆位点等。可以使用本领域的技术人员所熟知的方法来构建包含编码肽或多肽的序列的表达载体,以及可操作地连接至其的适当的转录和翻译控制/调控元件。这些方法包括体外重组DNA技术、合成技术和体内基因重组。这样的技术在Sambrook.et al.(1989)Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Press,Plainview,N.Y.,以及Ausubel,F.M.et al.(1989)Current Protocols in Molecular Biology,JohnWiley&Sons,New York,N.Y.中描述。“可操作地连接”是指元件特别是核酸序列的并置,使得元件的正常功能得以进行。因此,可操作地连接至调控序列的编码序列是指其中编码序列可以在调控控制,即调控序列的转录和/或翻译控制下表达的核苷酸序列的配置。如本文所用,“调控/控制区”或“调控/控制序列”是指涉及编码核酸表达的调控的非编码核苷酸序列。因此,术语调控区域包括启动子序列,调控蛋白质结合位点、上游激活因子序列等。在实施方式中,本公开的编码肿瘤抗原肽的核酸(DNA、RNA)被包括或包裹在囊泡,诸如脂质体内。

在其他方面,本公开提供了包括(即,呈递或结合至)肿瘤抗原肽的MHC I类分子。在实施方式中,MHC I类分子是HLA-A2分子,在进一步实施方式中,是HLA-A*02:01分子。在实施方式中,MHC I类分子是HLA-A11分子,在进一步的实施方式中,是HLA-A*11:01分子。在实施方式中,MHC I类分子是HLA-A24分子,在进一步的实施方式中,是HLA-A*24:02分子。在其他实施方式中,MHC I类分子是HLA-B07分子,在进一步的实施方式中,是HLA-B*07:02分子。在其他实施方式中,MHC I类分子是HLA-B08分子,在进一步的实施方式中,是HLA-B*08:01分子。在其他实施方式中,MHC I类分子是HLA-B40分子,在进一步的实施方式中,是HLA-B*40:01。在其他实施方式中,MHC I类分子是HLA-C07分子,在进一步的实施方式中,是HLA-C*07:01分子。在实施方式中,肿瘤抗原肽非共价结合至MHC I类分子(即,肿瘤抗原肽被装载至或非共价结合至MHC I类分子的肽结合槽/袋中)。在其他实施方式中,肿瘤抗原肽共价连接/结合至MHC I类分子(α链)。在这样的构建体中,肿瘤抗原肽和MHC I类分子(α链)被生产为合成融合蛋白,典型地具有短的(例如,5至20个残基,优选地约8-12个,例如,10个)灵活的接头或间隔子(例如,聚甘氨酸接头)。在其他方面,本公开提供了编码包括本文定义的融合至MHC I类分子(α链)的肿瘤抗原肽的融合蛋白的核酸。在实施方式中,MHC I类分子(α链)–肽复合体是多聚体化的。因此,在其他方面,本公开提供了负载(共价或非共价)有本文所提及的肿瘤抗原肽的MHC I类分子的多聚体。这样的多聚体可以连接至标签上,例如允许多聚体的检测的荧光标签。目前已开发了大量策略用于生产MHC多聚体,包括MHC二聚体、四聚体、五聚体、八聚体等(在Bakker and Schumacher,Current Opinion in Immunology2005,17:428-433综述)。MHC多聚体可用于例如,检测和纯化抗原特异性T细胞。因此,在其他方面,本公开提供了用于检测或纯化(分离、富集)特异于本文定义的肿瘤抗原肽的CD8

在又一方面,本公开提供了包括本文所提及的肿瘤抗原肽、核酸、本公开的载体或质粒,即编码一种或多种肿瘤抗原肽的核酸或载体的细胞(例如,宿主细胞),在实施方式中,是分离的细胞。在另一方面,本公开提供了在其表面表达结合至根据本公开的肿瘤抗原肽的MHC I类分子(例如,上文公开的等位基因之一的MHC I类分子)或呈递根据本公开的肿瘤抗原肽的细胞。在一种实施方式中,宿主细胞是真核细胞,诸如哺乳动物细胞,优选地人细胞、细胞系或永生化细胞。在其他实施方式中,细胞是抗原呈递细胞(APC),诸如树突状细胞(DC)或单核细胞/巨噬细胞(macropage)。在一种实施方式中,宿主细胞是原代细胞(primary cell)、细胞系或永生化细胞。可以经由常规转化或转染技术将核酸和载体引入细胞。术语“转化”和“转染”是指将外来核酸引入宿主细胞的技术,包括磷酸钙或氯化钙共沉淀、DEAE-右旋糖酐-介导的转染、脂质体转染、电穿孔、微注射以及病毒介导的转染。合适的转化或转染宿主细胞的方法可以例如参见Sambrook et al.(见上)以及其他实验室手册。用于将核酸引入哺乳动物体内细胞的方法也是已知的,并可以用于将本公开的载体或质粒递送至基因治疗的受试者。

可以使用本领域已知的各种方法用一种或多种肿瘤抗原肽负载细胞,诸如APC。如本文所用,用肿瘤抗原肽“负载细胞”意指将编码肿瘤抗原肽的RNA(mRNA)或DNA或肿瘤抗原肽转染至细胞或替代地用编码肿瘤抗原肽的核酸转化APC。细胞也可以通过与将细胞与外来的肿瘤抗原肽接触来负载,所述肿瘤抗原肽可以直接结合至存在于细胞表面的MHC I类分子(例如,肽冲击的细胞)。也可以将肿瘤抗原肽融合到促进通过MHC I类分子的呈递的结构域或基序中,例如融合至内质网(ER)回收信号(retrieval signal),C末端Lys-Asp-Glu-Leu序列(参见Wang et al.,Eur J Immunol.2004Dec;34(12):3582-94)。

在其他方面,本公开提供了包括本文所定义的肿瘤抗原肽(或编码所述一种或多种肽的核酸)中的任一种或任何组合的组合物或肽组合/库。在实施方式中,组合物包括本文定义的肿瘤抗原肽的任何组合(2、3、4、5、6、7、8、9、10或更多种肿瘤抗原肽的任何组合)或编码所述肿瘤抗原肽的核酸的组合。包括本文所定义的肿瘤抗原肽的组合/子组合的组合物涵盖在本公开中。在实施方式中,组合物或肽组合/库包括至少2、3、4、5、6、7、8、9、10种肿瘤抗原肽,所述肿瘤抗原肽包括以下或由以下组成:SEQ ID NO:17-28所示的序列。在实施方式中,组合物或肽组合/库包括至少2、3、4、5、6、7、8、9、10种肿瘤抗原肽,所述肿瘤抗原肽包括以下或由以下组成:SEQ ID NO:29-39所示的序列。在其他实施方式中,组合物或肽组合/库可以包括一种或多种已知的肿瘤抗原。

因此,在其他方面,本公开提供了包括本文所定义的肿瘤抗原肽的任一种或任何组合,以及表达MHC I类分子(例如,如上文公开的等位基因之一的MHC I类分子)的细胞的的组合物。本公开使用的APC不限于特定类型的细胞并且包括专职性APC,诸如树突状细胞(DC)、朗格汉斯细胞(Langerhans cell)、巨噬细胞/单核细胞以及B细胞,已知它们在细胞表面呈递蛋白质抗原以便被CD8

第一受试者和第二受试者可以是同一受试者(例如,自体疫苗),或者可以是不同的受试者(例如,同种异体疫苗)。替代地,根据本公开,使用本文所述的肿瘤抗原肽(或其组合物)用于制造用于诱导抗原呈递细胞的组合物(例如,药物组合物)。此外,本公开提供了用于制造用于诱导抗原呈递细胞的药物组合物的方法或工艺,其中该方法或工艺包括混合或配制肿瘤抗原肽或其与药学上可接受的载体的组合。负载有本文所定义的肿瘤抗原肽的任一种或任何组合的表达MHC I类分子(例如,HLA-A2、HLA-A11、HLA-A24、HLA-B07、HLA-B08、HLA-B40或HLA-C07分子)的细胞诸如APC可以用于刺激/扩增CD8

在实施方式中,组合物进一步包括缓冲剂、赋形剂、载体、稀释剂和/或介质(例如,培养基)。在进一步实施方式中,缓冲剂、赋形剂、载体、稀释剂和/或介质是药学上可接受的一种或多种缓冲剂、一种或多种赋形剂、一种或多种载体、一种或多种稀释剂和/或一种或多种介质。如本文所用,“药学上可接受的缓冲剂、赋形剂、载体、稀释剂和/或介质”包括生理上相容的、不会干扰一种或多种活性成分的生物活性的有效性并且对受试者是无毒的任何和所有溶剂、粘合剂、润滑剂、填充剂、增稠剂、崩解剂、增塑剂、包衣、阻挡层制剂、润滑剂、稳定剂、缓释剂、分散介质、包衣、抗细菌和抗真菌剂、等渗剂等。这样的用于药学上的活性物质的介质和制剂的使用是本领域所熟知的(Rowe et al.,Handbook ofpharmaceutical excipients,2003,4

在其他方面,本公开提供了一种组合物,包括本文所定义的肿瘤抗原肽(或编码所述一种或多种肽的核酸)中的任一种或任何组合以及缓冲剂、赋形剂、载体、稀释剂和/或介质中的一种或多种。对于包括细胞(例如,APC、T淋巴细胞)的组合物,该组合物包括允许维持活细胞的合适的介质。这样的介质的代表性实例包括生理盐水溶液、Earl平衡盐溶液(Life

在实施方式中,一种或多种肿瘤抗原肽或包括所述一种或多种肿瘤抗原肽的组合物是冻干的形式。在其他实施方式中,一种或多种肿瘤抗原肽或包括所述一种或多种肿瘤抗原肽的组合物是液体组合物。在进一步实施方式中,一种或多种肿瘤抗原肽在组合物中的浓度为约0.01μg/mL至约100μg/mL。在进一步实施方式中,一种或多种肿瘤抗原肽在组合物中的浓度为约0.2μg/mL至约50μg/mL、约0.5μg/mL至约10、20、30、40或50μg/mL、约1μg/mL至约10μg/mL或约2μg/mL。

如上所述,表达负载有或结合至本文所定义的肿瘤抗原肽中的任一种或任何组合的MHC I类分子的细胞诸如APC可以用于在体内或离体刺激/扩增CD8

在一些实施方式中,在(同种异体干细胞移植(ASCL)、同种异体淋巴细胞输注或自体淋巴细胞输注之前或之后,对使用本公开的组合物(例如,药物组合物)治疗的患者治疗进行治疗。本公开的组合物包括:针对肿瘤抗原肽离体激活的同种异体T淋巴细胞(例如,CD8

本公开提供了由肿瘤抗原肽(即,与在细胞表面表达的MHC I类分子结合的肿瘤抗原肽),或肿瘤抗原肽的组合特异性诱导、激活和/或扩增(扩展)的分离的CD8

本公开进一步涉及根据本公开的任何肿瘤抗原肽、核酸、表达载体、T细胞受体、细胞(例如,T淋巴细胞、APC)和/或组合物或其任何组合作为药物或在制造药物中的用途。在实施方式中,药物用于癌症的治疗,例如,癌症疫苗。本公开涉及根据本公开的任何肿瘤抗原肽、核酸、表达载体、T细胞受体、细胞(例如,T淋巴细胞,APC)和/或组合物(例如,疫苗组合物)或其任何组合,用于治疗癌症例如,作为癌症疫苗(例如,治疗性癌症疫苗)的用途。本文鉴定的肿瘤抗原肽序列可以被用于生产适合于以下的合成肽:i)体外致敏(priming)和扩增待注射至肿瘤患者内的肿瘤抗原特异性T细胞,和/或ii)作为疫苗来诱导或加强癌症患者的抗肿瘤T细胞响应。

在其他方面,本公开提供了本文所述的肿瘤抗原肽或其组合(例如,肽库)作为疫苗用于治疗受试者的癌症的用途。在其他方面,本公开也提供了本文所述的肿瘤抗原肽或其组合(例如,肽库),作为疫苗用于治疗受试者的癌症的用途。在实施方式中,受试者是肿瘤抗原肽特异性CD8

在其他方面,本公开提供了识别负载有(呈递)肿瘤抗原肽的一种或多种MHC I类分子的CD8

本公开也提供了在受试者中产生针对表达负载有本公开的任何肿瘤抗原肽或其组合的人MHC I类分子的肿瘤细胞的免疫响应的方法,该方法包括给药特异性识别负载有肿瘤抗原肽或肿瘤抗原肽组合的MHC I类分子的细胞毒性T淋巴细胞。本公开也提供了特异性识别负载有本文公开的肿瘤抗原肽中的任一种或肿瘤抗原肽的组合的I类MHC分子的细胞毒素T淋巴细胞用于产生针对表达负载有肿瘤抗原肽或其组合的人I类MHC分子的肿瘤细胞的免疫应答的用途。

在实施方式中,本文所述方法或用途进一步包括在治疗/使用前确定由患者表达的HLAI类等位基因,以及给药或使用结合至由患者表达的HLA I类等位基因中的一种或多种的肿瘤抗原肽。例如,如果确定患有B-ALL的患者表达HLA-A2*01和HLA-B*08:01,则可以在患者中给药或使用(i)SEQ ID NO:17-19、27和/或28(与HLA-A2*01结合)以及(ii)SEQ IDNO:24或25(与HLA-B08*01结合)的肿瘤抗原肽的任何组合。

在实施方式中,要治疗的癌症,例如,白血病或肺癌的肿瘤细胞表达本文(SEQ IDNO:17-39)公开的肿瘤抗原肽中的一种或多种。在其他实施方式中,本文所述方法或用途进一步包括确定来自患者的肿瘤细胞是否表达本公开的肿瘤抗原肽(SEQ ID No:17-39)中的一种或多种,以及给药或使用由来自患者的肿瘤细胞表达的肿瘤抗原肽中的一种或多种以治疗癌症。

在实施方式中,癌症是血癌或血液系统癌症,例如,白血病、淋巴瘤和骨髓瘤。在实施方式中,癌症是白血病,包括但不限于急性淋巴细胞白血病(ALL)、急性髓性白血病(AML)、慢性淋巴细胞白血病(CLL)、慢性髓性白血病(CML)、毛细胞白血病(HCL)、T细胞性幼淋巴细胞白血病(T-PLL)、大颗粒淋巴细胞白血病或成人T细胞性白血病。在其他实施方式中,癌症是淋巴瘤,包括但不限于霍奇金淋巴瘤(HL)、非霍奇金淋巴瘤(HL)、伯基特淋巴瘤、前体T细胞白血病/淋巴瘤、滤泡性淋巴瘤、弥漫大B细胞淋巴瘤、套细胞淋巴瘤、B细胞慢性淋巴细胞白血病/淋巴瘤或MALT淋巴瘤。在进一步的实施方式中,癌症是B细胞白血病,诸如B-ALL。

在其他实施方式中,癌症是实体癌,诸如肺癌。在进一步的实施方式中,肺癌是非小细胞肺癌(NSCLC)。在实施方式中,肺癌是肺鳞状细胞肺癌(SQCLC)、腺癌、或大细胞未分化性癌(LCAC)。

在实施方式中,本文公开的肿瘤抗原肽、核酸、载体、组合物可以与其他治疗(例如,抗肿瘤疗法),诸如,化疗、免疫治疗(例如,基于CAR T/NK细胞的治疗、基于检查点抑制剂的治疗、基于抗体治疗)、放射治疗或外科手术联合使用。免疫检查点抑制剂的实例包括抑制PD-1、PD-L1、CTLA-4、KIR、CD40、TIM-3或LAG-3的药剂,诸如阻断抗体。用于化疗的药剂的实例包括,例如,安吖啶、博来霉素、白消安、卡培他滨、卡铂、卡莫司汀、苯丁酸氮芥、顺铂、克拉立滨、氯法拉滨、克立他酶(crisantaspase)、环磷酰胺、阿糖胞苷、达卡巴嗪、放线菌素D、柔红霉素、多西他赛、多柔比星、表柔比星、依托泊苷、氟达拉滨、氟尿嘧啶(5-FU)、吉西他滨、gliadelimplants、羟基脲、伊达比星、异环磷酰胺、伊立替康、亚叶酸、脂质体多柔比星(liposomaldoxorubicin)、脂质体柔红霉素(liposomaldaunorubicin)、洛莫司汀、美法仑、巯嘌呤、美司钠、甲氨蝶呤、丝裂霉素、米托蒽醌、奥沙利铂、紫杉醇(paclitaxel)(紫杉醇(Taxol))、培美曲塞、喷司他丁、丙卡巴肼、雷替曲塞、沙铂、链佐星、替加氟-尿嘧啶、替莫唑胺、替尼泊苷、塞替派、硫鸟嘌呤、拓扑替康、曲奥舒凡、长春碱、长春新碱、长春地辛、长春瑞滨或其组合物。或者,化疗的药剂可以是生物药剂,包括针对HER2抗原的赫赛汀

用于ALL的现有的治疗典型地包括长春新碱、地塞米松或泼尼松、以及蒽环素药物诸如多柔比星(Adriamycin)或柔红霉素。同种异体干细胞移植(allo-SCT)也可以在高风险患者和具有复发/难治性疾病的患者中进行。正在临床开发的治疗B-ALL的其他药剂包括抗-CD22、抗-CD20和抗-CD19抗体,以及蛋白酶体抑制剂(硼替佐米)、JAK/STAT信号通路抑制剂(鲁索替尼(ruxolitinib)),低甲基化药物(地西他滨)以及PI3K/mTOR抑制剂(参见例如,Terwilliger and Abdul-Hay,Blood Cancer J.2017Jun;7(6):e577)。

肺癌的目前的治疗典型地包括外科手术、放射治疗、用小分子酪氨酸激酶抑制剂的化疗(厄洛替尼、克唑替尼)以及用检查点抑制剂诸如抗-PD1抗体(帕博利珠单抗)的免疫治疗(参见例如,Dholaria et al.,J Hematol Oncol.2016;9:138)。

进行本发明的一种或多种模式

在以下的非限制性实施例中对本发明的进一步细节进行详细阐述。

实施例1:材料与方法

小鼠.C57BL/6小鼠获自Jackson实验室(巴尔港,缅因州(Bar Harbor,ME))。小鼠被安置在特定的无病原体的条件下。

细胞系.EL4 T-淋巴母细胞性淋巴瘤细胞系、CT26结直肠癌细胞细和B细胞杂交瘤HB-124获自美国模式培养物集存库(ATCC)。将EL4和CT26细胞在补充有10%热灭活的胎牛血清、1%L-谷氨酰胺和1%青霉素-链霉素的RPMI 1640/HEPES中培养。细胞培养基进一步补充有1%非必需氨基酸以及1%丙酮酸钠或分别仅针对EL4和CT26细胞补充有1%丙酮酸钠。为了产生抗-CDR2抗体,将HB-124细胞在补充有10%热灭活的胎牛血清的IMDM中培养。除非另有说明,所有试剂均购自

人原发样品.本研究中使用的原发白血病样品(四种B-ALL标本:07H103、10H080、10H118和12H018)收集并冷冻保存于Maisonneuve-Rosemont医院(

肽.天然的和

鼠mTEC

人TEC和mTEC的提取.胸腺从3月龄至7年龄的接受矫正心血管手术的个体获得(CHU Saint Justine Research Ethic Board,protocol and biobank#2126)。简而言之,胸腺在4℃保持于包含介质的50ml锥形管中,在手术切除后数小时内切成2-5mm的立方体。对于长期保存,胸腺立方体冷冻在包含有热灭活的人血清/10%DMSO的小瓶中冷冻,且在液氮中保存最多3年。冷冻保存的胸腺样品在干冰上转移,并按照改编自C.Stoeckle et al.

RNA提取、文库的制备和测序.对于EL4和CT26细胞,5x 10

产生经典的癌症和正常蛋白质组.对于所有样品,使用Trimmomatic版本0.35来从RNA-Seq读段上修剪掉测序接头和低质量3'碱基,以及然后使用STAR版本2.5.1b

产生癌症和正常k-mer数据库。对于所有的癌症和正常样品,R1和R2 fastq文件都是独立下载,并且使用Trimmomatic版本0.35以修剪掉测序接头和低质量3'碱基。为了确保所有的读段在转录物编码链上,R1读段是使用FASTX-Toolkit版本0.0.14的fastx_reverse_complement功能进行了反向互补。使用jellyfish 2.2.3

k-mer过滤和癌症特异性蛋白质组的产生.为了提取可能会引起TSA的33个核苷酸长的k-mer,分析只限于在EL4或CT26 k-mer细胞中观察到至少4次、肺肿瘤活检物中至少7次以及原发白血病样品中至少10次的k-mer。然后通过对在相关的mTEC

MAP分离.对于EL4和CT26细胞,250x 10

质谱分析.将干燥的MAP提取物全部重新悬浮于0.2%甲酸中。对于EL4和CT26,MAP提取物负载在自制的C

MAP的鉴定。为了选择MAP,对从Peaks获得的唯一标识的列表过滤,以包括8至11个氨基酸长的肽,所述肽对于相关的MHC I类分子上的至少一个具有的百分等级≤2%,如NetMHC 4.0

TSA候选物的鉴定和验证。为了在所有的鉴定的MAP中鉴定TSA候选物,对每一对MAP/蛋白质进行免疫原性状态分配。为此,将每个MAP及其相关的一个或多个MAP编码序列(MCS)分别在相关癌症和正常个性化蛋白质组或癌症和正常24个核苷酸长度k-mer数据库中查询。在正常经典的蛋白质组中检测到的MAP,不论它们的MCS检测状态如何,都被排除在外,因为它们可能是致耐受性的。真正的癌症特异性的MAP,即,在正常经典的蛋白质组和正常k-mer中均未检测到,被标记为TSA候选物。在两种经典的蛋白质组都不存在但在两种k-mer数据库都存在的MAP,需要使它们的MCS在癌细胞中相对正常细胞过表达至少10倍,这样才可以被标记为TSA候选物(参见图8A)。最后,通过若干种MCS编码的MAP(来自不同的蛋白质)仅在它们各自的MCS一致的情况下才能被标记为TSA候选物,即,如果一致地标记此MAP作为TSA候选物。人工检查所有TSA候选物的MS/MS谱以清除任何假鉴定。此外,具有多个基因组上可能的I/L变体的呈递的序列,当它们可以通过质谱来区分时,进行进一步检查来报告这两种变体,当它们不能通过质谱来区分时,只报告表达最多的变体(参见图8B)。最终,通过使用BLAT(来自UCSC基因组浏览器的工具)在参考基因组(GRCm38.87或GRCh38.88)上映射包含MCS的读段,将基因组定位分配给所有经MS验证的TSA候选物。那些其读段与一致的基因组定位不匹配或匹配至高可变区(诸如MHC、Ig或TCR基因)或多个基因的TSA候选物被排除在外。对于具有一致的基因组定位的那些,使用Integrative Genome Viewer(IGV)

MCS的外周表达.为了评估TAA的和aeTSA候选物的MCS的外周表达,使用了RNA-Seq数据,其来自(1)用ENCODE联合体

TSA候选物的MS验证。对于CT26 TSA候选物和两个EL4 TSA候选物(ATQQFQQL–SEQID NO:11and SSPRGSSTL-SEQ ID NO:13),将先前获得的MS/MS谱与相关的

在人TEC和mTEC样品中检测到的转录物的累积数目。将分析限制在六个样品中(2个TEC和6个mTEC)中的至少一个在tpm>1下表达的转录物上,计算每个1-对-1TEC/mTEC比较的斯皮尔曼等级相关系数。然后,使用这些表达的转录物的相同的集合,在分析每个额外的样品时计算检测到的转录物的累积数目(cT)。因为在分析中样品被引入的顺序可能影响cT值,所有样品排列方式的cT值被平均化,并且这些平均数据点用于拟合以下预测曲线(R的‘nls’函数):

产生源自骨髓的树突状细胞(DC)、小鼠免疫接种以及EL4细胞注射。源自骨髓的DC如前所述

IFN-γELISpot和亲合力测定法.如前所述

淋巴组织中的细胞分离和基于四聚体的富集方案脾脏和腹股沟、腋羽、腕板、颈和肠系膜淋巴结均从C57BL/6小鼠收获。将单细胞悬浮液用Fc block和10nM的PE-或APC标记的pMHC I四聚体(NIH Tetramer Core Facility)在4℃下染色30分钟。在使用冰冷的分选缓冲液(PBS与2%FBS)洗涤之后,将细胞重新悬浮在200μL的分选缓冲液中以及50μL的抗-PE和/或抗-APC抗体缀合的磁性微球(Miltenyi Biotech),随后将细胞在4℃下孵育20分钟。如前所述

数据.关于本研究中使用的所有样品的信息列举在表7中。在图1中使用的测序和表达数据,已经存入NCBI's Sequen0e Read Archive和GEO中,其均可以在GEO的SuperSeries登录码GSE113992下访问,分别包含鼠类或人测序和表达数据的GSE111092和GSE113972登录码。SuperSeries记录可以经由https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE113992访问,通过在方框中输入通行证cnutscacjbkzteb。在图1中使用的MS原始数据和相关的数据库,已经经由PRIDE

实施例2:用于TSA发现的蛋白质基因组学方法的基本原理和设计。

使用各种算法在计算上预测TSA的尝试充满了极高的假发现率

实施例3:非编码区是TSA的主要来源。

在5%的假发现率下,鉴定了在CT26细胞上的1,875个MAP和EL4细胞的上783个MAP。在那些中,如果(i)它们的源自全癌症限制的33个核苷酸长的k-mer的33个核苷酸长的MAP编码序列(MCS)在mTEChi转录组中不存在或如果(ii)它们的源自癌症限制的33个核苷酸长的k-mer的截短版本的24-至-30核苷酸长的MCS在癌症的转录组中相比于mTEC

为了评估基于从癌症k-mer中移出mTEC

对似乎最有吸引力的TSA中的一些进行进一步的研究,即,由EL4细胞呈递的那些,其MCS不被任何正常组织表达(表2C和表1b)。为了评估他们的免疫原性,在使用活EL4细胞攻击前,将C57BL/6小鼠分别用未冲击的(对照组)或TSA冲击的DC免疫接种2次。针对IILEFHSL或TVPLNHNTL的致敏(priming)可以延长10%的小鼠生存期,只有TVPLNHNTL免疫接种的小鼠存活最长达150天(图3A)。其他三种TSA示出了第150天的存活率分别为20%(VNYIHRNV)、30%(VTPVYQHL)和100%(VNYLHRNV)(图3B,C)。为了评估TSA疫苗接种的长期功效,存活的小鼠在第150天再次接受活EL4的攻击,监测疾病迹象。两个VNYIHRNV免疫接种的幸存者在50天内死于白血病,然而所有其他(针对TVPLNHNTL、VTPVYQHL或VNYLHRNV免疫接种的)在再次攻击个中幸存(图3)。因此,可以推断针对单独的TSA的免疫接种提供了不同程度的对抗EL4细胞的保护,而且在大多数情况下,这种保护是长效的。

实施例4:在幼稚和免疫接种的小鼠中的TSA特异性T细胞的频率.

在各种模型中,在体内的免疫应答的强度是通过抗原反应性T细胞的数目的调节的

合在一起,这些结果示出了TSA特异性T细胞的频率总体上是TSA免疫原性的显著的参数。然而,VTPVYQHL对EL4攻击提供了第二好的保护,即使其同源T细胞以非常低的频率出现(图3和4A-C)。为了更好地评估T细胞扩增在白血病保护中的重要性,评估了在第150天用EL4细胞再次攻击后,长期的幸存者中的四聚体

实施例5:抗原表达对对抗EL4细胞的保护的重要性。

接下来,通过评估第0天注射的EL4细胞群中的RNA水平上的TSA的丰度来评估抗原表达对免疫原性的影响(图3)。发现编码提供最好的对抗EL4细胞的保护的TSA的序列(VNYLHRNV)比其他TSA以高得多的水平表达(图5A)。这表明VNYLHRNV可能是“克隆的”(由所有EL4细胞表达)以及高表达的,而其他TSA是亚克隆的和/或以低水平表达。接下来,使用平行反应监测(PRM)MS来分析用于再次攻击(第150天,图5B)的EL4细胞群上的每个细胞的TSA拷贝数。在RNA和肽水平上的TSA丰度之间没有线性关系

实施例6:非编码区扩展人原发性肿瘤TSA的景观.

已经论证了非编码区是TSA在两种鼠类细胞系中的主要来源,本文所述的蛋白质基因组学方法被应用至七种人原发性肿瘤样品:四种B系ALL和三种肺癌。为此,不使用来自鼠类同系mTEC

虽然本发明在上文已通过其具体实施例进行了描述,但可以在不背离所附权利要求书中所定义的主体发明的精神和性质的情况下,对其进行修改。在权利要求书中,词语“包括(comprising)”作为开放式术语使用,实质上等同于短语“包括但不限于”。除非上下文另有明确指示,单数形式“一个或一种(a)”、“一个或一种(an)”和“所述(The)”包括相应的复数指代。

参考文献

1.Mlecnik,B.,et al.The tumor microenvironment and immunoscore arecritical determinants of dissemination to distant metastasis.Sci Transl Med8,327ra326(2016).

2.Charoentong,P.,et al.Pan-cancer immunogenomic analyses revealgenotype-immunophenotype relationships and predictors of response tocheckpoint blockade.Cell Rep 18,248-262(2017).

3.Shao,W.,et al.The systeMHC Atlas project.Nucleic Acids Res 46,D1237-D1247(2018).

4.Martin,S.D.,Coukos,G.,Holt,R.A.&Nelson,B.H.Targeting theundruggable:Immunotherapy meets personalized oncology in the genomic era.AnnOncol 26,2367-2374(2015).

5.Marty,R.,et al.MHC-I genotype restricts the oncogenic mutationallandscape.Cell 171,1272-1283e1215(2017).

6.Zhong,S.,et al.T-cell receptor affinity and avidity definesantitumor response and autoimmunity in T-cell immunotherapy.Proc Natl AcadSci U S A110,6973-6978(2013).

7.Sahin,U.,et al.Personalized RNA mutanome vaccines mobilize poly-specific therapeutic immunity against cancer.Nature 547,222-226(2017).

8.Turajlic,S.,et al.Insertion-and-deletion-derived tumour-specificneoantigens and the immunogenic phenotype:a pan-cancer analysis.Lancet Oncol18,1009-1021(2017).

9.Yadav,M.,et al.Predicting immunogenic tumour mutations by combiningmass spectrometry and exome sequencing.Nature 515,572-576(2014).

10.Pearson,H.,et al.MHC class I-associated peptides derive fromselective regions of the human genome.J Clin Invest 126,4690-4701(2016).

11.Tran,E.,et al.Immunogenicity of somatic mutations in humangastrointestinal cancers.Science 350,1387-1390(2015).

12.Gros,A.,et al.Prospective identification of neoantigen-specificlymphocytes in the peripheral blood of melanoma patients.Nat Med 22,433-438(2016).

13.Bassani-Sternberg,M.,et al.Direct identification of clinicallyrelevant neoepitopes presented on native human melanoma tissue by massspectrometry.Nat Commun 7,13404(2016).

14.Mertens,F.,Johansson,B.,Fioretos,T.&Mitelman,F.The emergingcomplexity of gene fusions in cancer.Nat Rev Cancer 15,371-381(2015).

15.Baca,S.C.,et al.Punctuated evolution of prostate cancergenomes.Cell 153,666-677(2013).

16.Hayward,N.K.,et al.Whole-genome landscapes of major melanomasubtypes.Nature 545,175-180(2017).

17.Khurana,E.,et al.Role of non-coding sequence variants incancer.Nat Rev Genet 17,93-108(2016).

18.Laumont,C.M.,et al.Global proteogenomic analysis of human MHCclass I-associated peptides derived from non-canonical reading frames.NatCommun 7,10238(2016).

19.Rooney,M.S.,Shukla,S.A.,Wu,C.J.,Getz,G.&Hacohen,N.Molecular andgenetic properties of tumors associated with local immune cytolyticactivity.Cell 160,48-61(2015).

20.Charoentong,P.,et al.Pan-cancer Immunogenomic Analyses RevealGenotype-Immunophenotype Relationships and Predictors of Response toCheckpoint Blockade.Cell Rep 18,248-262(2017).

21.Anwar,S.L.,Wulaningsih,W.&Lehmann,U.Transposable Elements in HumanCancer:Causes and Consequences of Deregulation.Int J Mol Sci 18(2017).

22.Kassiotis,G.&Stoye,J.P.Immune responses to endogenousretroelements:taking the bad with the good.Nat Rev Immunol 16,207-219(2016).

23.Kershaw,M.H.,et al.Immunization against endogenous retroviraltumor-associated antigens.Cancer Res 61,7920-7924(2001).

24.Sacha,J.B.,et al.Vaccination with cancer-and HIV infection-associated endogenous retrotransposable elements is safe and immunogenic.JImmunol 189,1467-1479(2012).

25.Malarkannan,S.,Serwold,T.,Nguyen,V.,Sherman,L.A.&Shastri,N.Themouse mammary tumor virus env gene is the source of a CD8+ T-cell-stimulatingpeptide presented by a major histocompatibility complex class I molecule in amurine thymoma.Proc Natl Acad Sci U S A 93,13991-13996(1996).

26.Huang,A.Y.,et al.The immunodominant major histocompatibilitycomplex class I-restricted antigen of a murine colon tumor derives from anendogenous retroviral gene product.Proc Natl Acad Sci U S A 93,9730-9735(1996).

27.Schiavetti,F.,Thonnard,J.,Colau,D.,Boon,T.&Coulie,P.G.Ahumanendogenous retroviral sequence encoding an antigen recognized on melanoma bycytolytic T lymphocytes.Cancer Res 62,5510-5516(2002).

28.Takahashi,Y.,et al.Regression of human kidney cancer followingallogeneic stem cell transplantation is associated with recognition of anHERV-E antigen by T cells.J Clin Invest 118,1099-1109(2008).

29.Kim,M.J.,Miller,C.M.,Shadrach,J.L.,Wagers,A.J.&Serwold,T.Young,proliferative thymic epithelial cells engraft and function in agingthymuses.J Immunol 194,4784-4795(2015).

30.Dobin,A.,et al.STAR:ultrafast universal RNA-seqaligner.Bioinformatics 29,15-21(2013).

31.Quinlan,A.R.&Hall,I.M.BEDTools:a flexible suite of utilities forcomparing genomic features.Bioinformatics 26,841-842(2010).

32.Caron,E.,et al.The MHC I immunopeptidome conveys to the cellsurface an integrative view of cellular regulation.Mol Syst Biol 7,533(2011).

33.Andreatta,M.&Nielsen,M.Gapped sequence alignment using artificialneural networks:application to the MHC class I system.Bioinformatics 32,511-517(2016).

34.Robinson,J.T.,et al.Integrative genomics viewer.Nat Biotechnol 29,24-26(2011).

35.Bereman,M.S.,et al.An Automated Pipeline to Monitor SystemPerformance in Liquid Chromatography-Tandem Mass Spectrometry ProteomicExperiments.J Proteome Res 15,4763-4769(2016).

36.Yue,F.,et al.A comparative encyclopedia of DNA elements in themouse genome.Nature 515,355-364(2014).

37.Barbosa-Morais,N.L.,et al.The evolutionary landscape ofalternative splicing in vertebrate species.Science 338,1587-1593(2012).

38.Patenaude,J.&Perreault,C.Thymic Mesenchymal Cells Have a DistinctTranscriptomic Profile.J Immunol 196,4760-4770(2016).

39.St-Pierre,C.,Trofimov,A.,Brochu,S.,Lemieux,S.&Perreault,C.Differential Features of AIRE-Induced and AIRE-Independent Promiscuous GeneExpression in Thymic Epithelial Cells.J Immunol 195,498-506(2015).

40.Dumont-Lagace,M.,St-Pierre,C.&Perreault,C.Sex hormones havepervasive effects on thymic epithelial cells.Sci Rep 5,12895(2015).

41.Dumont-Lagace,M.,Brochu,S.,St-Pierre,C.&Perreault,C.Adult thymicepithelium contains nonsenescent label-retaining cells.J Immunol 192,2219-2226(2014).

42.de Verteuil,D.A.,et al.Immunoproteasomes shape the transcriptomeand regulate the function of dendritic cells.J Immunol 193,1121-1132(2014).

43.de Verteuil,D.,et al.Deletion of immunoproteasome subunitsimprints on the transcriptome and has a broad impact on peptides presented bymajor histocompatibility complex I molecules.Mol Cell Proteomics 9,2034-2047(2010).

44.Moon,J.J.,et al.Naive CD4(+)T cell frequency varies for differentepitopes and predicts repertoire diversity and response magnitude.Immunity27,203-213(2007).

45.Legoux,F.P.&Moon,J.J.Peptide:MHC tetramer-based enrichment ofepitope-specific T cells.J Vis Exp(2012).

46.McFarland,H.I.,Nahill,S.R.,Maciaszek,J.W.&Welsh,R.M.CD11b(Mac-1):amarker for CD8+cytotoxic T cell activation and memory in virus infection.JImmunol 149,1326-1333(1992).

47.Chadburn,A.,Inghirami,G.&Knowles,D.M.Hairy cell leukemia-associated antigen LeuM5(CD11c)is preferentially expressed by benignactivated and neoplastic CD8 T cells.Am J Pathol 136,29-37(1990).

48.Nesvizhskii,A.I.Proteogenomics:concepts,applications andcomputational strategies.Nat Methods 11,1114-1125(2014).

49.Noble,W.S.Mass spectrometrists should search only for peptidesthey care about.Nat Methods 12,605-608(2015).

50.Murphy,J.P.,et al.MHC-I Ligand Discovery Using Targeted DatabaseSearches of Mass Spectrometry Data:Implications for T-Cell Immunotherapies.JProteome Res 16,1806-1816(2017).

51.Granados,D.P.,et al.Impact of genomic polymorphisms on therepertoire of human MHC class I-associated peptides.Nat Commun 5,3600(2014).

52.Bassani-Sternberg,M.,Pletscher-Frankild,S.,Jensen,L.J.&Mann,M.Massspectrometry of human leukocyte antigen class I peptidomes revealsstrongeffects of protein abundance and turnover on antigen presentation.Mol CellProteomics 14,658-673(2015).

53.Fortier,M.H.,et al.The MHC class I peptide repertoire is molded bythe transcriptome.J Exp Med 205,595-610(2008).

54.Jenkins,M.K.&Moon,J.J.The role of naive T cell precursor frequencyand recruitment in dictating immune response magnitude.J Immunol188,4135-4140(2012).

55.Obar,J.J.,Khanna,K.M.&Lefrancois,L.Endogenous naive CD8+ T cellprecursor frequency regulates primary and memory responses toinfection.Immunity 28,859-869(2008).

56.La Gruta,N.L.,et al.Primary CTL response magnitude in mice isdetermined by the extent of naive T cell recruitment and subsequent clonalexpansion.J Clin Invest 120,1885-1894(2010).

57.Mueller,S.N.,Gebhardt,T.,Carbone,F.R.&Heath,W.R.Memory T cellsubsets,migration patterns,and tissue residence.Annu Rev Immunol 31,137-161(2013).

58.Baaten,B.J.,Tinoco,R.,Chen,A.T.&Bradley,L.M.Regulation of Antigen-Experienced T Cells:Lessons from the Quintessential Memory Marker CD44.FrontImmunol 3,23(2012).

59.Laugel,B.,et al.Different T cell receptor affinity thresholds andCD8coreceptor dependence govern cytotoxic T lymphocyte activation andtetramer binding properties.J Biol Chem 282,23799-23810(2007).

60.Richards,D.M.,Kyewski,B.&Feuerer,M.Re-examining the Nature andFunction of Self-Reactive T cells.Trends Immunol 37,114-125(2016).

61.McGranahan,N.,et al.Clonal neoantigens elicit T cellimmunoreactivity and sensitivity to immune checkpoint blockade.Science 351,1463-1469(2016).

62.Assarsson,E.,et al.A quantitative analysis of the variablesaffecting the repertoire of T cell specificities recognized after vacciniavirus infection.J Immunol 178,7890-7901(2007).

63.Martin,S.D.,et al.Low Mutation Burden in Ovarian Cancer May Limitthe Utility of Neoantigen-Targeted Vaccines.PLoS One 11,e0155189(2016).

64.Rudensky,A.,Preston-Hurlburt,P.,Hong,S.C.,Barlow,A.&Janeway,C.A.,Jr.Sequence analysis of peptides bound to MHC class II molecules.Nature 353,622-627(1991).

65.Meydan,C.,Otu,H.H.&Sezerman,O.U.Prediction of peptides binding toMHC class I and II alleles by temporal motif mining.BMC Bioinformatics 14Suppl 2,S13(2013).

66.Szpakowski,S.,et al.Loss of epigenetic silencing in tumorspreferentially affects primate-specific retroelements.Gene 448,151-167(2009).

67.Capietto,A.H.,Jhunjhunwala,S.&Delamarre,L.Characterizingneoantigens for personalized cancer immunotherapy.Curr Opin Immunol 46,58-65(2017).

68.Helft,J.,et al.GM-CSF Mouse Bone Marrow Cultures Comprise aHeterogeneous Population of CD11c(+)MHCII(+)Macrophages and DendriticCells.Immunity 42,1197-1211(2015).

69.Wimmers,F.,Schreibelt,G.,Skold,A.E.,Figdor,C.G.&De Vries,I.J.Paradigm Shift in Dendritic Cell-Based Immunotherapy:From in vitroGenerated Monocyte-Derived DCs to Naturally Circulating DC Subsets.FrontImmunol 5,165(2014).

70.Guilliams,M.&Malissen,B.A Death Notice for In-Vitro-Generated GM-CSF Dendritic Cells?Immunity 42,988-990(2015).

71.Melief,C.J.,van Hall,T.,Arens,R.,Ossendorp,F.&van der Burg,S.H.Therapeutic cancer vaccines.J Clin Invest 125,3401-3412(2015).

72.Guo,C.,et al.Therapeutic cancer vaccines:past,present,andfuture.Adv Cancer Res 119,421-475(2013).

73.Melero,I.,et al.Therapeutic vaccines for cancer:an overview ofclinical trials.Nat Rev Clin Oncol 11,509-524(2014).

74.Baruch,E.N.,Berg,A.L.,Besser,M.J.,Schachter,J.&Markel,G.Adoptive Tcell therapy:An overview of obstacles and opportunities.Cancer 123,2154-2162(2017).

75.Rosenberg,S.A.&Restifo,N.P.Adoptive cell transfer as personalizedimmunotherapy for human cancer.Science 348,62-68(2015).

76.Stoeckle,C.,et al.Isolation of myeloid dendritic cells andepithelial cells from human thymus.J Vis Exp,e50951(2013).

77.Marcais,G.&Kingsford,C.A fast,lock-free approach for efficientparallel counting of occurrences of k-mers.Bioinformatics 27,764-770(2011).

1a.Lanoix,J.,et al.Comparison of the MHC I immunopeptidome repertoireof B-cell lymphoblasts using two isolation methods.Proteomics,e1700251(2018).

2a.Kim,M.J.,Miller,C.M.,Shadrach,J.L.,Wagers,A.J.&Serwold,T.Young,proliferative thymic epithelial cells engraft and function in agingthymuses.J Immunol 194,4784-4795(2015).

3a.Stoeckle,C.,et al.Isolation of myeloid dendritic cells andepithelial cells from human thymus.J Vis Exp,e50951(2013).

4a.Dobin,A.,et al.STAR:Ultrafast universal RNA-seqaligner.Bioinformatics 29,15-21(2013).

5a.Daouda,T.,Perreault,C.&Lemieux,S.pyGeno:A python package forprecision medicine and proteogenomics.F1000Res 5,381(2016).

6a.Marcais,G.&Kingsford,C.A fast,lock-free approach for efficientparallel counting of occurrences of k-mers.Bioinformatics 27,764-770(2011).

7a.Caron,E.,et al.The MHC I immunopeptidome conveys to the cellsurface an integrative view of cellular regulation.Mol Syst Biol 7,533(2011).

8a.Andreatta,M.&Nielsen,M.Gapped sequence alignment using artificialneural networks:Application to the MHC class I system.Bioinformatics32,511-517(2016).

9a.Robinson,J.T.,et al.Integrative genomics viewer.Nat Biotechnol 29,24-26(2011).

10a.Yue,F.,et al.A comparative encyclopedia of DNA elements in themouse genome.Nature 515,355-364(2014).

11a.Sloan,C.A.,et al.ENCODE data at the ENCODE portal.Nucleic AcidsRes 44,D726-732(2016).

12a.Bereman,M.S.,et al.An automated pipeline to monitor systemperformance in liquid chromatography-tandem mass spectrometry proteomicexperiments.J Proteome Res 15,4763-4769(2016).

13a.de Verteuil,D.,et al.Deletion of immunoproteasome subunitsimprints on the transcriptome and has a broad impact on peptides presented bymajor histocompatibility complex I molecules.Mol Cell Proteomics 9,2034-2047(2010).

14a.Vincent,K.,et al.Rejection of leukemic cells requires antigen-specific T cells with high functional avidity.Biol Blood Marrow Transplant20,37-45(2014).

15a.Moon,J.J.,et al.Naive CD4(+)T cell frequency varies for differentepitopes and predicts repertoire diversity and response magnitude.Immunity27,203-213(2007).

16a.Legoux,F.P.&Moon,J.J.Peptide:MHC tetramer-based enrichment ofepitope-specific T cells.J Vis Exp 68,4420(2012).

17a.McFarland,H.I.,Nahill,S.R.,Maciaszek,J.W.&Welsh,R.M.CD11b(Mac-1):A marker for CD8+cytotoxic T cell activation and memory in virus infection.JImmunol 149,1326-1333(1992).

18a.Chadburn,A.,Inghirami,G.&Knowles,D.M.Hairy cell leukemia-associated antigen LeuM5(CD11c)is preferentially expressed by benignactivated and neoplastic CD8 T cells.Am J Pathol 136,29-37(1990)

19a.Vizcaino,J.A.,et al.2016 update of the PRIDE database and itsrelated tools.Nucleic Acids Res 44,11033(2016)。

序列列表

<110> 蒙特利尔大学 (UNIVERSITÉ DE MONTRÉAL)

<120> 用于鉴定肿瘤特异性抗原的基于蛋白质基因组学的方法

<130> PPI21170041CA

<150> US 62/724,760

<151> 2018-08-30

<160> 42

<170> PatentIn version 3.5

<210> 1

<211> 9

<212> PRT

<213> 小鼠 (Mus musculus)

<400> 1

Gly Tyr Gln Lys Met Lys Ala Leu Leu

1 5

<210> 2

<211> 9

<212> PRT

<213> 小鼠 (Mus musculus)

<220>

<221> 变体

<222> (4)..(4)

<223> Xaa 是 Lys 或 Glu

<400> 2

Lys Pro Leu Xaa Ala Pro Leu Asp Leu

1 5

<210> 3

<211> 9

<212> PRT

<213> 小鼠 (Mus musculus)

<220>

<221> 变体

<222> (7)..(7)

<223> Xaa 是 Ser 或 Gly

<400> 3

Lys Tyr Leu Ser Val Gln Xaa Gln Leu

1 5

<210> 4

<211> 10

<212> PRT

<213> 小鼠 (Mus musculus)

<220>

<221> 变体

<222> (7)..(7)

<223> Xaa 是 Ser 或 Gly

<400> 4

Lys Tyr Leu Ser Val Gln Xaa Gln Leu Phe

1 5 10

<210> 5

<211> 11

<212> PRT

<213> 小鼠 (Mus musculus)

<400> 5

Leu Pro Gln Glu Leu Pro Gly Leu Val Val Leu

1 5 10

<210> 6

<211> 11

<212> PRT

<213> 小鼠 (Mus musculus)

<400> 6

Met Pro His Ser Leu Leu Pro Leu Val Thr Phe

1 5 10

<210> 7

<211> 9

<212> PRT

<213> 小鼠 (Mus musculus)

<220>

<221> 变体

<222> (8)..(8)

<223> Xaa 是 Ile 或 Leu

<400> 7

Gln Gly Pro Met Ala Leu Arg Xaa Phe

1 5

<210> 8

<211> 9

<212> PRT

<213> 小鼠 (Mus musculus)

<400> 8

Ser Gly Pro Pro Tyr Tyr Lys Gly Ile

1 5

<210> 9

<211> 8

<212> PRT

<213> 小鼠 (Mus musculus)

<400> 9

Ser Pro His Gln Val Phe Asn Leu

1 5

<210> 10

<211> 9

<212> PRT

<213> 小鼠 (Mus musculus)

<400> 10

Ser Pro Ser Tyr Val Tyr His Gln Phe

1 5

<210> 11

<211> 8

<212> PRT

<213> 小鼠 (Mus musculus)

<400> 11

Ala Thr Gln Gln Phe Gln Gln Leu

1 5

<210> 12

<211> 8

<212> PRT

<213> 小鼠 (Mus musculus)

<400> 12

Ile Ile Leu Glu Phe His Ser Leu

1 5

<210> 13

<211> 9

<212> PRT

<213> 小鼠 (Mus musculus)

<400> 13

Ser Ser Pro Arg Gly Ser Ser Thr Leu

1 5

<210> 14

<211> 9

<212> PRT

<213> 小鼠 (Mus musculus)

<400> 14

Thr Val Pro Leu Asn His Asn Thr Leu

1 5

<210> 15

<211> 8

<212> PRT

<213> 小鼠 (Mus musculus)

<220>

<221> 变体

<222> (4)..(4)

<223> Xaa 是 Ile 或 Leu

<400> 15

Val Asn Tyr Xaa His Arg Asn Val

1 5

<210> 16

<211> 8

<212> PRT

<213> 小鼠 (Mus musculus)

<400> 16

Val Thr Pro Val Tyr Gln His Leu

1 5

<210> 17

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<400> 17

Lys Ile Leu Ile Leu Leu Gln Ser Leu

1 5

<210> 18

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<400> 18

Lys Ile Ser Leu Tyr Leu Pro Ala Leu

1 5

<210> 19

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<400> 19

Ser Leu Thr Ala Leu Val Phe His Val

1 5

<210> 20

<211> 8

<212> PRT

<213> 智人 (Homo sapiens)

<400> 20

His Glu Thr Leu Arg Leu Leu Leu

1 5

<210> 21

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<400> 21

Arg Ile Phe Gly Phe Arg Leu Trp Lys

1 5

<210> 22

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<400> 22

Thr Ser Phe Ala Glu Thr Trp Met Lys

1 5

<210> 23

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<400> 23

Thr Ser Ile Pro Lys Pro Asn Leu Lys

1 5

<210> 24

<211> 8

<212> PRT

<213> 智人 (Homo sapiens)

<400> 24

Leu Pro Phe Glu Gln Lys Ser Leu

1 5

<210> 25

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<400> 25

Ser Leu Arg Glu Lys Gly Phe Ser Ile

1 5

<210> 26

<211> 8

<212> PRT

<213> 智人 (Homo sapiens)

<400> 26

Val Pro Ala Ala Leu Arg Ser Leu

1 5

<210> 27

<211> 10

<212> PRT

<213> 智人 (Homo sapiens)

<400> 27

Leu Leu Ala Ala Thr Ile Leu Leu Ser Val

1 5 10

<210> 28

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<220>

<221> 变体

<222> (5)..(5)

<223> Xaa 是 Ala 或 Val

<400> 28

Ser Leu Phe Val Xaa Ser Leu Ser Leu

1 5

<210> 29

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<400> 29

Ile Ile Ala Pro Pro Pro Pro Pro Lys

1 5

<210> 30

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<400> 30

Leu Val Phe Asn Ile Ile Leu His Arg

1 5

<210> 31

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<400> 31

Met Ile Ser Pro Val Leu Ala Leu Lys

1 5

<210> 32

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<400> 32

Ser Leu Ser Tyr Leu Ile Leu Lys Lys

1 5

<210> 33

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<400> 33

Ser Ser Ala Ser Gln Leu Pro Ser Lys

1 5

<210> 34

<211> 10

<212> PRT

<213> 智人 (Homo sapiens)

<400> 34

Ser Val Ile Gln Thr Gly His Leu Ala Lys

1 5 10

<210> 35

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<400> 35

Thr Thr Leu Lys Tyr Leu Trp Lys Lys

1 5

<210> 36

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<400> 36

Lys Pro Ser Val Phe Pro Leu Ser Leu

1 5

<210> 37

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<220>

<221> 变体

<222> (2)..(2)

<223> Xaa 是 Arg 或 Lys

<220>

<221> 变体

<222> (3)..(3)

<223> Xaa 是 Phe 或 Leu

<400> 37

Gln Xaa Xaa Gln Gly Arg Val Thr Met

1 5

<210> 38

<211> 10

<212> PRT

<213> 智人 (Homo sapiens)

<400> 38

Ser Arg Phe Ser Gly Val Pro Asp Arg Phe

1 5 10

<210> 39

<211> 9

<212> PRT

<213> 智人 (Homo sapiens)

<220>

<221> 变体

<222> (5)..(5)

<223> Xaa 是 Asn 或 Asp

<400> 39

Thr Tyr Thr Gln Xaa Phe Asn Lys Phe

1 5

<210> 40

<211> 9

<212> PRT

<213> 淋巴细胞脉络丛脑膜炎病毒

<400> 40

Lys Ala Val Tyr Asn Phe Ala Thr Cys

1 5

<210> 41

<211> 9

<212> PRT

<213> 鼠类巨细胞病毒

<400> 41

His Gly Ile Arg Asn Ala Ser Phe Ile

1 5

<210> 42

<211> 8

<212> PRT

<213> 牛痘病毒

<400> 42

Thr Ser Tyr Lys Phe Glu Ser Val

1 5

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号