首页> 中国专利> 结核分枝杆菌免疫优势抗原的组合物和方法

结核分枝杆菌免疫优势抗原的组合物和方法

摘要

来自病原体结核分枝杆菌的多种抗原的组合物、装置和方法,以及它们在疫苗、治疗剂和各种诊断测试中的用途。在尤其优选的方面,所述抗原是免疫优势抗原并且对感染了病原体的群体的血清具有已量化且已知的相对反应性,和/或具有与疾病参数的已知相关性。

著录项

  • 公开/公告号CN102573896A

    专利类型发明专利

  • 公开/公告日2012-07-11

    原文格式PDF

  • 申请/专利权人 因波特医疗股份有限公司;梁小武;

    申请/专利号CN200980160460.8

  • 发明设计人 P.菲尔格纳;M.L.金纳罗;

    申请日2009-05-13

  • 分类号A61K39/04(20060101);C12Q1/68(20060101);

  • 代理机构11105 北京市柳沈律师事务所;

  • 代理人闵丹

  • 地址 美国加利福尼亚州

  • 入库时间 2023-12-18 06:00:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-05-11

    授权

    授权

  • 2012-09-12

    实质审查的生效 IPC(主分类):A61K39/04 申请日:20090513

    实质审查的生效

  • 2012-07-11

    公开

    公开

说明书

发明领域

本发明的领域是与结核分枝杆菌选定抗原有关的组合物和方法,特别是 涉及在诊断性和治疗性组合物和方法中的用途。

背景

用于免疫接种和/或诊断目的的抗原通常是来自病原体的单一抗原,或 者是来自病原体的多个已知抗原的复杂混合物,或病原体的多个已知和未知 抗原的复杂混合物,比如活的、减毒的或灭活的细菌或病毒。根据病原体的 具体类型,单一抗原可能在免疫诊断测试(抗体或细胞反应)中提供量化信号。 然而,由于个体免疫反应情况的不同,单一抗原检测往往不足以获得具备有 用的特异性和敏感性的可用诊断信息。

例如,准确诊断结核病(TB)往往需要多项测试。最典型的,对于被怀疑 感染结核分枝杆菌的人使用结核菌素皮试(TST)进行检测,该项测试经常会 给出各异的结果,使得对结果的解释很少一致。替代的测试是干扰素γ释放 检验(IGRAs)。这些检验比TST测试特异性更强,但它们仍然不能提供一个 方法将带有活动性结核病的人与染菌了但目前没有活跃的疾病进程的人区 分开来。对于活动性结核病的调查,可以采用痰抗酸杆菌涂片检验来直接鉴 定结核分枝杆菌,该项检验往往能提供良好的特异性。但是,不同实验室之 间的灵敏度差别很大。为了获得较明确的结果,可以由例如痰或其它体液进 行细菌培养来诊断活动性结核病。不幸的是,这样的测试需要一个专门的微 生物实验室,并且要几个星期才能得到结果。近期发展的方法,比如实时 PCR检测相对准确,但需要复杂的设备和训练有素的人员,而且非常容易受 到样品之间的交叉污染。

鉴于以上的缺陷,需要开发基于抗体的测试,所述测试能够克服与细菌 培养、基因分析或其他已知方法相关的至少某些困难。大量工作已致力于界 定和识别结核分枝杆菌膜组分中的和结核分枝杆菌条件培养基(“培养滤液 蛋白”或CFPS)中的免疫反应性蛋白。通常在ELISA和Western印迹中利用 TB血清和来自健康对照的血清检测候选抗原是否可用于诊断。由于可溶性 蛋白操作方面的便利,CFPS得到更广泛的研究。在培养滤液里>100M的结 核蛋白(代表大约2.5%的结核分枝杆菌蛋白质组)中,大约二十几个被来自 TB患者的血清识别,其中大部分此前已得到鉴定。然而,尽管这些努力, 仍然没有具备准确诊断结核病(尤其是在感染的早期阶段)所需的灵敏度和特 异性的有效血清学检测。此外,迄今已知的抗原都不能普遍适用于区分疾病 的不同阶段(例如,活动性疾病与非活动性)、继发感染等,因为信号或者无 法去卷积(deconvolute)(例如,来自灭活病原体的复合信号)或者只提供了一个 单一的数据点。

同样,对于已知抗原在疫苗中的使用,我们知道有许多由于个体免疫反 应的差异和潜在的先前接触带来的问题。最近,已出现了多价疫苗制品,所 述制品在单个剂量中结合了来自单一病原生物体的多种不同血清型的多个 不同抗原(PrevnarTM:抗肺炎链球菌荚膜血清型4、6B、9V、14、18C、19F 和23F的7价疫苗)。虽然这种混合制剂往往提供了抗不同血清型的更广范 的保护,但各种困难仍然存在。最显著的是,当单一抗原不能引起免疫反应 时,就涵盖不了抗相应血清型的保护。因此,来自几个血清型的单一确定抗 原的组合,只是将与单一抗原关联的好处和问题合并在了一起。

因此,尽管本领域已知的抗原鉴定和使用方法有很多,但它们全部或几 乎全部都有一个或多个缺点。因此,对于用在TB诊断和治疗中的来自结核 分枝杆菌的抗原的改进组合物和方法仍然存在一个很大的尚未满足的需求。

发明概述

本发明涉及来自结核分枝杆菌的免疫优势抗原,其中所述抗原已知对来 自感染病原体的患者群的血清有反应,即对所述血清有已知的反应性(尤其 是已知的相对反应性)。因此,本文介绍的抗原在统计学上有高概率在比较 大的患者群体中引发免疫反应。此外,对于确定是来自选定亚群(例如,活 跃阶段、潜伏阶段、过去的感染、先前的接种、没有感染或者合并感染了其 他病原体等)的抗原,抗原也可能具有与疾病参数的已知相关性。

发明主题的一个方面,抗原组合物包含由选自SEQ ID NO:1至586(或 者这些序列的任何亚组)的核酸或其片段所编码的复数种结核分枝杆菌抗 原,其中至少有两个抗原能够引发免疫反应。

发明主题的其他考虑方面,抗原组合物包含致病生物体的两个或两个以 上的免疫优势抗原,并且抗原与载体相连,其中所述抗原与感染了生物体的 群体的血清有已量化且已知的相对反应性,其中所述抗原与疾病参数有已知 的相关性。最优选地,免疫优势抗原是多肽,由具有SEQ ID NO:1至SEQ  ID NO:586序列(或包含其片段)的核酸所编码。

还考虑了所述已知反应性可以由多种因素表征,但是,特别优选已知反 应性是由免疫原性强度和/或感染的时间进程表征。通常优选参数是疾病的 活跃状况、以前与病原体的接触、与病原体的接触时间、慢性感染、过去的 疾病、活动性感染、非活动性感染、对病原体感染的至少部分免疫,和/或 经过治疗的结果。

发明主题的另一个方面,载体是医药学可接受的载体,组合物被制成疫 苗。这些方面中,通常优选疫苗包含多个抗原(例如,至少有两个、四个或 六个)。再进一步考虑了抗原或其片段是至少部分纯化和/或重组的。

再有的考虑方面,载体也可能是固体载体,多个抗原在载体上排列为混 合物或者阵列。在这类阵列中,优选抗原具有至少两种不同的反应性和/或 参数。还考虑了抗原或其片段可能处于未加工的表达提取物、部分纯化的形 式(例如,低于60%的纯度)、或者高度纯化的形式(例如,至少95%的纯度)。 这种阵列中的抗原可以是重组的或天然的。替代地,固相不必局限于平面阵 列,而是还可以包括珠子、柱子、试纸条(dipstick)形式等等。

本发明的方面包括利用结核分枝杆菌的至少两种免疫优势抗原进行的 诊断方法。抗体检测包括:将含有抗结核分枝杆菌的抗体的体液样本(例如血 清)与至少两种本发明的免疫优势抗原进行接触;通过任何令人满意的方法, 优选通过生色或产生荧光信号来检测抗原抗体结合。例如,固定在固体表面 的抗原(或者各自分布在离散的区域或者是混合物)可用于固定样品中的抗 体,然后可以加入直接或间接连接着生色酶的抗抗体以便在标准ELISA形 式中产生信号。替代地,通过比如将抗抗体(直接或间接地)连接荧光发射物 质的方法,可以生成荧光信号。本发明的方面还包括使用游离于溶液,而不 是固定在表面上的至少两种免疫优势抗原。例如,外周血样本,含有T淋巴 细胞的体液,可以与此类抗原在体外接触。T淋巴细胞和(抗原呈递细胞上的) 抗原之间的反应和抗原抗体反应一样,都是表位特异的,即使T淋巴细胞和 抗体可能识别不同的表位。如果抗原被识别,T淋巴细胞产生至少一种细胞 因子(比如干扰素γ),后者然后被(直接或间接)标记的抗体所检测。本发明的 方面还包括执行检测的试剂盒。根据本发明,这些试剂盒包含至少两种免疫 优势抗原。

由以下对优选实施方案的详细描述连同附图(同样的数字代表同样的成 分),发明主题的各种目的、特征、方面和优势将更加明显。

附图说明

图1A和1B描绘了分别用来自TB阳性和LTBI阴性(即没有感染结核分 枝杆菌)个体的血清探测的示范性微阵列。

图2A和2B描绘了示范性TB阳性和LTBI阴性结果的信号统计差异。

图2C的表列出了使用优选的示范性排序算法选定的TB抗原。

图3A和3B描绘了示范性微阵列的示范性荧光和比色显谱,各自的散 点图表明显谱之间的相关性。

图4A和4B描述了随机森林、CERNO和经CERNO预过滤数据的随机 森林中的蛋白质排名。

图5描述的蛋白质在TB样品中显示更高强度信号的尾分布,这在非TB 样品中未看到。

发明详述

发明人发现了适合诊断和治疗目的的多种来自结核分枝杆菌的免疫优 势抗原。特别优选的免疫优势抗原是具有SEQ ID NO:1至SEQ ID NO:586 序列的核酸所编码的那些抗原,通常设想这种抗原在生产各种诊断装置、治 疗组合物和疫苗中可作为单一抗原,或(任选与来自另一种病原体的抗原)组 合使用。优选适用于诊断和治疗目的的免疫优势抗原是由如下命名的序列编 码的:RvO798c(SEQ ID NO:121)、Rvl886c(SEQ ID NO:270)、Rv2031c(SEQ  ID NO:284)、Rv3616c(SEQ ID NO:509)、Rv3804c(SEQ ID NO:534)、 Rv3874(SEQ ID NO:547)、Rv0302(SEQ ID NO:52)、RvO379(SEQ ID NO: 65)、RvO394c(SEQ ID NO:66)、RvO456c(SEQ ID NO:74)、RvO632c(SEQ  ID NO:103)、RvO944(SEQ ID NO:142)、RvO984(SEQ ID NO:146)、 Rvl030(SEQ ID NO:153)、RvI196(SEQ ID NO:174)、Rvl242(SEQ ID NO: 180)、Rvl284(SEQ ID NO:187)、Rvl387(SEQ ID NO:206)、Rvl837c(SEQ ID  NO:264)、Rvl926c(SEQ ID NO:275)、Rvl980c(SEQ ID NO:281)、Rv2094c (SEQ ID NO:294)、Rv2544(SEQ ID NO:363)、Rv2618(SEQ ID NO:375)、 Rv2746c(SEQ ID NO:391)、Rv2870c(SEQ ID NO:407)、Rv2873(SEQ ID NO: 408)、Rv2875(SEQ ID NO:409)、Rv3050c(SEQ ID NO:434)、Rv3248c(SEQ  ID NO:458)、Rv3376(SEQ ID NO:478)、Rv3763(SEQ ID NO:527)、 Rv3810(SEQ ID NO:536)、Rv3864(SEQ ID NO:545)、Rv2252(SEQ ID NO: 323)、Rv2282c(SEQ ID NO:569)、RvO212c(SEQ ID NO:557)、Rv3243c(SEQ  ID NO:456)、Rv3675(SEQ ID NO:519)、Rv2984(SEQ ID NO:423)、 RvI175c(SEQ ID NO:169)、Rv3326(SEQ ID NO:578)、Rv3628(SEQ ID NO: 513)、Rv3775(SEQ ID NO:584)、Rv3362c(SEQ ID NO:475)、Rv0801(SEQ  ID NO:122)、Rvl629(SEQ ID NO:566)、RvO272c(SEQ ID NO:558)、 Rv3762c(SEQ ID NO:583)、Rv3319(SEQ ID NO:577)、Rv3495c(SEQ ID NO: 581)、Rv2151c(SEQ ID NO:308)、RvO227c(SEQ ID NO:37)、Rv0280(SEQ  ID NO:50)、RvO993(SEQ ID NO:148)、Rvl306(SEQ ID NO:192)、 Rvl363c(SEQ ID NO:204)、Rv2050(SEQ ID NO:288)、Rv2116(SEQ ID NO: 299)、Rv3417c(SEQ ID NO:486)、Rv3653(SEQ ID NO:516)、Rvl253(SEQ  ID NO:182)、Rv3413c(SEQ ID NO:485)、Rvl635c(SEQ ID NO:232)、 Rv3021c(SEQ ID NO:432)、RvI193(SEQ ID NO:173)、Rv2592c(SEQ ID NO: 369)、Rv3620c(SEQ ID NO:510)、RvO929(SEQ ID NO:139)、RvO959(SEQ  ID NO:145)、RvI162(SEQ ID NO:166)、Rv2389c(SEQ ID NO:341)、 Rv2984(SEQ ID NO:423)、Rv2588c(SEQ ID NO:367)、RvO171(SEQ ID NO: 26)、RvI865c(SEQ ID NO:267)、Rv2074(SEQ ID NO:290)、RvO543c(SEQ  ID NO:87)、Rvl677(SEQ ID NO:237)、Rvl304(SEQ ID NO:191)、 Rv2841c(SEQ ID NO:400)、Rv3680(SEQ ID NO:520)、Rv0831c(SEQ ID NO: 125)、Rv2032(SEQ ID NO:285)、Rv3127(SEQ ID NO:446)、Rv3272(SEQ  ID NO:464)、Rv3323c(SEQ ID NO:470)、Rv3508(SEQ ID NO:494)、 Rv3628(SEQ ID NO:513)、RvI173(SEQ ID NO:167)、Rv2623(SEQ ID NO: 376)、RvO527(SEQ ID NO:85)、Rvl620c(SEQ ID NO:229)、Rvl901(SEQ ID  NO:272)、Rv2151c(SEQ ID NO:308)、Rv0362(SEQ ID NO:60)、Rv3129(SEQ  ID NO:447)、Rv3140(SEQ ID NO:449)、Rv0340(SEQ ID NO:56)、 Rv2792c(SEQ ID NO:395)、Rv3003c(SEQ ID NO:426)、Rv3019c(SEQ ID  NO:431)、Rv3862c(SEQ ID NO:544)、RvO572c(SEQ ID NO:91)、 Rv2477c(SEQ ID NO:356)、Rv2659c(SEQ ID NO:379)、Rv0311(SEQ ID NO: 54)、Rv0350(SEQ ID NO:57)、Rv2127(SEQ ID NO:301)、Rv3875(SEQ ID  NO:548)、RvO877(SEQ ID NO:134)、Rvl916(SEQ ID NO:274)、Rv2138(SEQ  ID NO:303)、Rv2847c(SEQ ID NO:403)、Rv3118(SEQ ID NO:444)、 Rv2495c(SEQ ID NO:358)、Rv3669(SEQ ID NO:517)、RvO281(SEQ ID NO: 51)、Rv2711(SEQ ID NO:383)、Rv2744c(SEQ ID NO:390)、Rv3803c(SEQ  ID NO:533)、Rvl239c(SEQ ID NO:179)、Rv2147c(SEQ ID NO:307)、 Rv2253(SEQ ID NO:324)、Rv0308(SEQ ID NO:53)、RvO587(SEQ ID NO: 95)、Rvl564c(SEQ ID NO:224)、Rv2185c(SEQ ID NO:313)、Rvl805c(SEQ  ID NO:261)、Rv2729c(SEQ ID NO:386)、Rv3386(SEQ ID NO:481)、 Rv3515c(SEQ ID NO:497)、RvO772(SEQ ID NO:116)、Rv2948c(SEQ ID NO: 420)、Rv0006(SEQ ID NO:1)、Rvl906c(SEQ ID NO:273)、Rv2244(SEQ ID  NO:322)、Rv2468c(SEQ ID NO:354)、Rv3701c(SEQ ID NO:522)、 Rv0054(SEQ ID NO:6)、Rvl945(SEQ ID NO:277)、Rv3345c(SEQ ID NO: 472)、RvO276(SEQ IDNO:48)、Rv0709(SEQ ID NO:108)、Rvl527c(SEQ  ID NO:220)、Rv2048c(SEQ ID NO:287)、Rv2414c(SEQ ID NO:345)、 Rv3524(SEQ ID NO:499)、Rv3556c(SEQ ID NO:502)、Rvl322(SEQ ID NO: 196)、Rv2934(SEQ ID NO:417)、Rv0270(SEQ ID NO:47)、RvO612(SEQ ID  NO:99)、Rvl699(SEQ ID NO:242)、Rv2728c(SEQ ID NO:385)、Rv3017c(SEQ  ID NO:430)、Rv3364c(SEQ ID NO:476)、Rv3418c(SEQ ID NO:487)、 Rv3718c(SEQ ID NO:525)、RvO426c(SEQ ID NO:70)、RvI181(SEQ ID NO: 171)、Rvl725c(SEQ IDNO:250)、RvO256c(SEQ IDNO:44)、Rv0605(SEQ  ID NO:98)、RvO737(SEQ ID NO:114)、RvO834c(SEQ ID NO:126)、 Rvl255c(SEQ ID NO:184)、Rv2224c(SEQ ID NO:320)、RvI843c(SEQ ID NO: 265)、Rv2333c(SEQ ID NO:334)、Rv2490c(SEQ ID NO:357)、Rv3183(SEQ  ID NO :454)、RvO668(SEQ ID NO:106)、Rvl556(SEQ ID NO:223)、 Rvl673c(SEQ ID NO:236)、Rv3513c(SEQ ID NO:496)、Rv3675(SEQ ID NO: 519)、Rv3870(SEQ ID NO:546)、Rv3891c(SEQ ID NO:552)、RvO163(SEQ  ID NO:24)、Rv0710(SEQ ID NO:109)、Rvl297(SEQ ID NO:189)、 Rvl745c(SEQ ID NO:255)、Rv0600c(SEQ ID NO:97)、Rvl536(SEQ ID NO: 222)、Rvl738(SEQ ID NO:254)、Rv2524c(SEQ IDNO:359)、Rv3086(SEQ  ID NO:440)、Rv3367(SEQ ID NO:477)、RvO135c(SEQ ID NO:20)、 RvO627(SEQ ID NO:101)、Rvl448c(SEQ ID NO:213)、Rv3224a(SEQ ID NO: 455)、Rv0029(SEQ ID NO:2)、RvO846c(SEQ ID NO:129)、RvI159(SEQ ID  NO:165)、RvI186c(SEQ ID NO:172)、Rvl705c(SEQ ID NO:243)、Rvl713(SEQ  ID NO:248)、Rv2476c(SEQ ID NO:355)、Rv3402c(SEQ ID NO:483)、 Rv2615c(SEQ ID NO:374)、Rv2995c(SEQ ID NO:425)、Rv3788(SEQ ID NO: 585)、Rv0140(SEQ ID NO:555)、Rv0203(SEQ ID NO:33)、Rvl531(SEQ ID  NO:565)、Rvl693(SEQ ID NO:241)、Rvl882c(SEQ ID NO:269)、Rv2143(SEQ  ID NO:568)、Rv2367c(SEQ ID NO:570)、RvO584(SEQ ID NO:94)、 Rvl651c(SEQ ID NO:567)、Rv3197a(SEQ ID NO:576)、Rv3369(SEQ ID NO: 579)、Rv3825c(SEQ ID NO:586)、RvOlOl(SEQ ID NO:15)、Rv0808(SEQ ID  NO:123)、RvO814c(SEQ ID NO:560)、Rv2153c(SEQ ID NO:309)、 Rv2933(SEQ ID NO:416)、Rv0071(SEQ ID NO:9)、Rv2471(SEQ ID NO: 571)、Rv2979c(SEQ ID NO:575)、RvO155(SEQ ID NO:556)、RvO581(SEQ  ID NO:559)、Rv2631(SEQ ID NO:377)、Rv3455c(SEQ ID NO:489)、 Rv3601c(SEQ ID NO:505)、RvO896(SEQ ID NO:562)、Rvl641(SEQ ID NO: 234)、Rv3005c(SEQ ID NO:427)、Rv3759c(SEQ ID NO:582)、Rv3800c(SEQ  ID NO:532)、RvO187(SEQ ID NO:30)、Rv2379c(SEQ ID NO:338)、 Rv2434c(SEQ ID NO:352)、Rv2940c(SEQ ID NO:574)、Rv3477(SEQ ID NO: 580)、RvO435c(SEQ ID NO:72)、RvO844c(SEQ ID NO:128)、RvO856(SEQ  ID NO:561)、RVI 191(SEQ ID NO:564)、Rv2803(SEQ ID NO:397)、 RvO783c(SEQ ID NO:118)、RvlO54(SEQ ID NO:563)、Rvl689(SEQ ID NO: 240)、Rv2539c(SEQ ID NO:572)、Rv2859c(SEQ ID NO:573)、Rv3777(SEQ  ID NO:528)及它们的片段。最优选地,免疫优势抗原是由被命名为 RvO798c(SEQ ID NO:121)、Rvl886c(SEQ ID NO:270)、Rv2031c(SEQ ID NO: 284)、Rv3616c(SEQ ID NO:509)、Rv3804c(SEQ ID NO:534)和Rv3874(SEQ  ID NO:547)的序列所编码。

用于本文,名词“免疫优势抗原”是指这样的抗原,所述抗原在接触该抗 原的群体的至少20%、更典型的至少40%、最典型的至少70%中,引发在 感染的至少一个阶段产生一或多种类型的抗体(例如,IgG、IgA、IgE、IgM 等),或者,其中与同一病原体的其他抗原相比,患者在至少一个疾病阶段 产生的抗体的平均结合亲和力和/或平均量至少在上半部分,更典型的在上 三分位数(upper tertile),最典型的在上四分位值(upper quartile)。最典型的, 抗体的平均结合亲和力和/或抗体的平均量反映在信号强度中,因此信号强 度可以用作抗体的平均结合亲和力和/或平均量的替代标记物。其他方面中, 优选的免疫优势抗原特征还在于,与对照信号强度相比,免疫优势抗原处理 组中的反应被认为有统计意义的显著性,其中显着性水平P优选等于或小于 0.1,更优选等于或小于0.05,最优选等于或小于0.01。

发明主题的一个方面,免疫优势抗原是对先前接触过病原体的血清群进 行蛋白组筛选鉴定到的。更优选地,将血清群细分为若干个子群体以反映疾 病的各种参数(如活动性疾病、疾病的细菌性负担、潜伏性感染、合并感染 HIV、没有感染等),然后可以与对鉴定到的抗原的抗体反应建立联系。进一 步优选的,筛选还提供了关于抗原与群体/亚群血清的相对反应性的数据。

通常优选获得病原体的至少部分基因组,通过电脑模拟确定所有潜在的 开放阅读框及其部分。潜在基因一经鉴定,确定合适的引物来提供整个开放 阅读框(ORF)的扩增子或者不太优选部分ORF的扩增子,其中引物优选设计 成便于向表达系统进行亚克隆。最优选亚克隆以未纯化的PCR混合物进行 基于重组酶的亚克隆,以避免克隆过程的偏向性,将这样获得的重组质粒经 多克隆扩增,即可保证扩增子无偏向性的被表现。还有特别优选的是然后将 质粒提取物进行体外转录/翻译反应,从而提供重组ORF肽,然后将肽点样 到或以其他方式固定到合适的可寻址载体(例如膜、珠子等)上。

应当意识到,这样制备的蛋白质组即可与血清进行接触,所述血清来自 对照个体群和/或已知当前或以前曾暴露于制备ORF的上述病原体的个体 群。然后使用众所周知的方法(例如,使用二抗)检测与一或多个ORF结合的 血清抗体。通过这种方式,可以快速评估病原体的整个蛋白质组的免疫原性 以及与血清中的抗体的潜在结合。国际专利公开WO 06/088492中公开了各 种优选的方面、组合物、和蛋白质组的制备方法,该申请通过引用并入本文。

因此,除了各种其他优势,应特别认识到本文提出的组合物和方法使得 能够制备包含复数种抗原的疫苗和诊断组合物,所述抗原对病原体靶ORF 具有已知的和预先确定的亲和力。因为已知个体免疫系统在抗原识别方面表 现出显著的差别,本文考虑的方法和组合物能够进行统计学支持的抗原鉴定 从而确定患者群体中的免疫优势抗原。因此,多个目标可用于引发免疫反应 和/或检测以前的接触,即使这些目标中的一或多个对于检测是模糊的或只 给出微弱的反应。

对于本文鉴定到的免疫优势序列,还应理解序列不必是完整的ORF,合 适的序列也可以是包含至少部分抗原表位的部分序列(例如合成的、重组的 或者分离的)。例如,设想的DNA序列包括那些与序列表中列出的相应序列 在严紧杂交条件下杂交的序列。因此,本文考虑的序列可能鉴定为编码抗原 肽(部分或完整ORF)的DNA序列,或者鉴定为肽序列(或同源序列)。类似地, 化学修饰抗原,和/或本文提出的多肽的直系同源物也被认为适用于本文。

特别值得一提的是,虽然蛋白质组筛选将提供复数种抗原作为可能用于 诊断、疫苗接种、和/或治疗的有用分子,这种方法只提供(多种)个体反应的 大概结果(raw cut)。因此,由于大多数个体对同一病原体的免疫反应(例如, 根据疾病的阶段、以往的接触,和/或个体间的差异)引发显著不同的抗体谱, 这种筛选得到的结果通常是不纯一的。这样必须考虑到个体免疫反应的差异 和阵列中重组蛋白量的差异来获得有意义的结果。

因此应当理解,对原始数据进行过滤将产生抗原集合,所述抗原对感染 了病原体的群体的血清有已量化并已知的相对反应性。而且,应该指出因为 信号可能在感染过程中是特定阶段特异性的,相对反应性可能指示感染的时 间进程,和/或相对反应性可能代表特定抗原免疫原性的强度差别(或筛选检 测中存在的抗原量)。此外,应特别认识到,根据对特定患者群体的选择, 测试血清将反映由一个或多个疾病参数表征的群体免疫状况。例如,可能观 察到被感染或未被感染的群体、长期接触或慢性感染的群体、自然恢复的群 体、代表对特定药物治疗有反应(或无反应)的群体、或对病原体有至少部分 免疫力的群体。

再有的考虑方面,免疫优势抗原是通过(优选在明确界定的亚群中)挑选 下述抗原鉴定的:(a)在群体的至少40-50%中产生可测量的信号,和(b)有整 体平均信号强度的至少40%的信号强度。然而,更优选信号强度是至少高 于整体平均信号强度,还要更优选的是信号强度位于检测中信号强度的上三 分位数(四分位数或者甚至五分位数)。因此,从另一个角度来看,免疫优势 抗原最好是通过至少两个系列的测试进行比较挑选到的,其中一个系列的测 试通常是亚群(例如,原发感染、活动性疾病、潜伏感染、恢复、以前患病、 慢性等),另一系列的测试是对照组(例如,其他亚群或对照组)。还有,通常 优选系列测试还包括潜在免疫优势抗原与之进行比较的阴性对照。

因此,特别是对于本文提出的病原体,应当理解可以制备包含一或多种 所选免疫优势抗原的组合物,所述组合物有统计学高概率能够在较大患者群 中引发或已经引发免疫反应。此外,对于抗原是从选定的亚群体(如活动性 疾病、疾病的严重程度、潜伏感染、以前患病的患者、原发感染等)中确定 的情况,抗原还与疾病参数有已知的关联,从而能够对疾病分期和/或预测 疗效。而且,因为本文提出的抗原是免疫优势抗原,应当指出可以制备的疫 苗组合物将有已知或者可预见的免疫原性。

更具体地说,由SEQ ID NO:1至SEQ ID NO:586的核酸所编码的来自 结核分枝杆菌的抗原被鉴定为免疫优势抗原(见以下实施例)。对于SEQ ID  NO:1至SEQ ID NO:586中每个序列的阅读框,应该指出的是,序列的第一 个碱基或者是起始密码子的第一个碱基,或者是通过本文提供的方法和组合 物鉴定到的多肽的第一密码子的第一个碱基。最典型的是,最后三个碱基代 表终止密码子,或者通过本文提供的方法和组合物鉴定的多肽的最后一个密 码子的最后一个碱基。

在这些例子中,对每个抗原,尤其针对它们对病原体的个体和相对反应 性进行了表征。最典型的,反应性以免疫原性的强度来测量(例如,抗体的 平均结合亲和力和/或平均数量产生预先确定的信号强度(例如,位于上半部 分、上三分位数、甚至上四分位数))。从不同角度来说,在以下描述的检测 中,每一个鉴定到的抗原相对鉴定到的另一个抗原具有已知的信号强度(反 映患者体内形成的抗体数量)。某些蛋白,比如图5所示的那个蛋白,在TB 样品中表现出更高强度信号的尾分布,而非TB样品中没有。这两个小提琴 图显示了log 10转换的信号强度的分布,所述信号强度是给来自TB病例的 血清vs.来自非TB病例的血清中的代表性蛋白测量的。以下描述的例子中 鉴定到具有这种特征性分布的蛋白是通过执行据其可以拒绝零假设的计算, 即样品文档只包含与非TB强度分布一致的反应性数值。

此外,每一个鉴定到的抗原还通过与至少一个参数的关联进行了表征。 大多数情况下,疾病参数是感染后的活动性疾病,进一步的情况中,疾病参 数是痰中的结核杆菌数量、或者疾病的放射照相学程度,在再进一步的情况 中,非患病人群中过去的病史。因此,应当尤其理解免疫优势抗原的鉴定不 仅可以使得鉴定到用于诊断、疫苗开发和治疗的统计学有意义的抗原,而且 使得能够开发疾病阶段特异的工具来鉴定候选分子对诊断和/或治疗进行微 调。

例如,合适的诊断装置尤其包括那些包含一或多种免疫优势抗原、或其 片段或类似物的装置,其中编码所述抗原、或其片段或类似物的核酸是SEQ  ID NO:1至SEQ ID NO:586的序列,优选RvO798c(SEQ ID NO:121)、 Rvl886c(SEQ ID NO:270)、Rv2031c(SEQ ID NO:284)、Rv3616c(SEQ ID  NO:509)、Rv3804c(SEQ ID NO:534)、Rv3874(SEQ ID NO:547)、Rv0302(SEQ  ID NO:52)、RvO379(SEQ ID NO:65)、Rv0394c(SEQ ID NO:66)、RvO456c (SEQ ID NO:74)、RvO632c(SEQ ID NO:103)、RvO944(SEQ ID NO:142)、 RvO984(SEQ ID NO:146)、Rvl030(SEQ ID NO:153)、RvI 196(SEQ ID NO: 174)、Rvl242(SEQ ID NO:180)、Rvl284(SEQ ID NO:187)、Rvl387(SEQ ID  NO:206)、Rvl837c(SEQ ID NO:264)、Rvl926c(SEQ ID NO:275)、Rvl980c (SEQ ID NO:281)、Rv2094c(SEQ ID NO:294)、Rv2544(SEQ ID NO:363)、 Rv2618(SEQ ID NO:375)、Rv2746c(SEQ ID NO:391)、Rv2870c(SEQ ID  NO:407)、Rv2873(SEQ ID NO:408)、Rv2875(SEQ ID NO:409)、Rv3050c(SEQ  ID NO:434)、Rv3248c(SEQ ID NO:458)、Rv3376(SEQ ID NO:478)、Rv3763 (SEQ ID NO:527)、Rv3810(SEQ ID NO:536)、Rv3864(SEQ ID NO:545)、 Rv2252(SEQ ID NO:323)、Rv2282c(SEQ ID NO:569)、RvO212c(SEQ ID  NO:557)、Rv3243c(SEQ ID NO:456)、Rv3675(SEQ ID NO:519)、Rv2984(SEQ  ID NO:423)、RvI175c(SEQ ID NO:169)、Rv3326(SEQ ID NO:578)、Rv3628 (SEQ ID NO:513)、Rv3775(SEQ ID NO:584)、Rv3362c(SEQ ID NO:475)、 Rv0801(SEQ ID NO:122)、Rvl629(SEQ ID NO:566)、RvO272c(SEQ ID  NO:558)、Rv3762c(SEQ ID NO:583)、Rv3319(SEQ ID NO:577)、Rv3495c (SEQ ID NO:581)、Rv2151c(SEQ ID NO:308)、RvO227c(SEQ ID NO:37)、 Rv0280(SEQ ID NO:50)、RvO993(SEQ ID NO:148)、Rvl306(SEQ ID  NO:192)、Rvl363c(SEQ ID NO:204)、Rv2050(SEQ ID NO:288)、Rv2116(SEQ  ID NO:299)、Rv3417c(SEQ ID NO:486)、Rv3653(SEQ ID NO:516)、Rvl253 (SEQ ID NO:182)、Rv3413c(SEQ ID NO:485)、Rvl635c(SEQ ID NO:232)、 Rv3021c(SEQ ID NO:432)、RvI193(SEQ ID NO:173)、Rv2592c(SEQ ID  NO:369)、Rv3620c(SEQ ID NO:510)、RvO929(SEQ ID NO:139)、RvO959 (SEQ ID NO:145)、RvI162(SEQ ID NO:166)、Rv2389c(SEQ ID NO:341)、 Rv2984(SEQ ID NO:423)、Rv2588c(SEQ ID NO:367)、RvO171(SEQ ID  NO:26)、Rvl865c(SEQ ID NO:267)、Rv2074(SEQ ID NO:290)、RvO543c(SEQ  ID NO:87)、Rvl677(SEQ ID NO:237)、Rvl304(SEQ ID NO:191)、Rv2841c (SEQ ID NO:400)、Rv3680(SEQ ID NO:520)、RvO831c(SEQ ID NO:125)、 Rv2032(SEQ ID NO:285)、Rv3127(SEQ ID NO:446)、Rv3272(SEQ ID  NO:464)、Rv3323c(SEQ ID NO:470)、Rv3508(SEQ ID NO:494)、Rv3628(SEQ  ID NO:513)、RvI173(SEQ ID NO:167)、Rv2623(SEQ ID NO:376)、RvO527 (SEQ ID NO:85)、Rvl620c(SEQ ID NO:229)、Rvl901(SEQ ID NO:272)、 Rv2151c(SEQ ID NO:308)、Rv0362(SEQ ID NO:60)、Rv3129(SEQ ID  NO:447)、Rv3140(SEQ ID NO:449)、Rv0340(SEQ ID NO:56)、Rv2792c(SEQ  ID NO:395)、Rv3003c(SEQ ID NO:426)、Rv3019c(SEQ ID NO:431)、Rv3862c (SEQ ID NO:544)、RvO572c(SEQ ID NO:91)、Rv2477c(SEQ ID NO:356)、 Rv2659c(SEQ ID NO:379)、RvO311(SEQ ID NO:54)、Rv0350(SEQ ID  NO:57)、Rv2127(SEQ ID NO:301)、Rv3875(SEQ ID NO:548)、RvO877(SEQ  ID NO:134)、Rvl916(SEQ ID NO:274)、Rv2138(SEQ ID NO:303)、Rv2847c (SEQ ID NO:403)、Rv3118(SEQ ID NO:444)、Rv2495c(SEQ ID NO:358)、 Rv3669(SEQ ID NO:517)、RvO281(SEQ ID NO:51)、Rv2711(SEQ ID  NO:383)、Rv2744c(SEQ ID NO:390)、Rv3803c(SEQ ID NO:533)、Rvl239c (SEQ ID NO:179)、Rv2147c(SEQ ID NO:307)、Rv2253(SEQ ID NO:324)、 Rv0308(SEQ ID NO:53)、RvO587(SEQ ID NO:95)、Rvl564c(SEQ ID  NO:224)、Rv2185c(SEQ ID NO:313)、Rvl805c(SEQ ID NO:261)、Rv2729c (SEQ ID NO:386)、Rv3386(SEQ ID NO:481)、Rv3515c(SEQ ID NO:497)、 RvO772(SEQ ID NO:116)、Rv2948c(SEQ ID NO:420)、Rv0006(SEQ ID  NO:1)、Rvl906c(SEQ ID NO:273)、Rv2244(SEQ ID NO:322)、Rv2468c(SEQ  ID NO:354)、Rv3701c(SEQ ID NO:522)、Rv0054(SEQ ID N0:6)、Rvl945(SEQ  ID NO:277)、Rv3345c(SEQ ID NO:472)、RvO276(SEQ ID NO:48)、Rv0709 (SEQ ID NO:108)、Rvl527c(SEQ ID NO:220)、Rv2048c(SEQ ID NO:287)、 Rv2414c(SEQ ID NO:345)、Rv3524(SEQ ID NO:499)、Rv3556c(SEQ ID  NO:502)、Rvl322(SEQ ID NO:196)、Rv2934(SEQ ID NO:417)、Rv0270(SEQ  ID NO:47)、RvO612(SEQ ID NO:99)、Rvl699(SEQ ID NO:242)、Rv2728c (SEQ ID NO:385)、Rv3017c(SEQ ID NO:430)、Rv3364c(SEQ ID NO:476)、 Rv3418c(SEQ ID NO:487)、Rv3718c(SEQ ID NO:525)、RvO426c(SEQ ID  NO:70)、RvI181(SEQ ID NO:171)、Rvl725c(SEQ ID NO:250)、RvO256c(SEQ  ID NO:44)、Rv0605(SEQ ID NO:98)、RvO737(SEQ ID NO:114)、RvO834c (SEQ ID NO:126)、Rvl255c(SEQ ID NO:184)、Rv2224c(SEQ ID NO:320)、 RvI843c(SEQ ID NO:265)、Rv2333c(SEQ ID NO:334)、Rv2490c(SEQ ID  NO:357)、Rv3183(SEQ ID NO:454)、RvO668(SEQ ID NO:106)、Rvl556(SEQ  ID NO:223)、Rvl673c(SEQ ID NO:236)、Rv3513c(SEQ ID NO:496)、Rv3675 (SEQ ID NO:519)、Rv3870(SEQ ID NO:546)、Rv3891c(SEQ ID NO:552)、 RvO163(SEQ ID NO:24)、Rv0710(SEQ ID NO:109)、Rvl297(SEQ ID  NO:189)、Rvl745c(SEQ ID NO:255)、Rv0600c(SEQ ID NO:97)、Rvl536(SEQ  ID NO:222)、Rvl738(SEQ ID NO:254)、Rv2524c(SEQ ID NO:359)、Rv3086 (SEQ ID NO:440)、Rv3367(SEQ ID NO:477)、RvO135c(SEQ ID NO:20)、 RvO627(SEQ ID NO:101)、Rvl448c(SEQ ID NO:213)、Rv3224a(SEQ ID  NO:455)、Rv0029(SEQ ID NO:2)、RvO846c(SEQ ID NO:129)、RvI159(SEQ ID NO:165)、RvI186c(SEQ ID NO:172)、Rvl705c(SEQ ID NO:243)、Rvl713 (SEQ ID NO:248)、Rv2476c(SEQ ID NO:355)、Rv3402c(SEQ ID NO:483)、 Rv2615c(SEQ ID NO:374)、Rv2995c(SEQ ID NO:425)、Rv3788(SEQ ID  NO:585)、Rv0140(SEQ ID NO:555)、Rv0203(SEQ ID NO:33)、Rvl531(SEQ  ID NO:565)、Rvl693(SEQ ID NO:241)、Rvl882c(SEQ ID NO:269)、Rv2143 (SEQ ID NO:568)、Rv2367c(SEQ ID NO:570)、RvO584(SEQ ID NO:94)、 Rvl651c(SEQ ID NO:567)、Rv3197a(SEQ ID NO:576)、Rv3369(SEQ ID  NO:579)、Rv3825c(SEQ ID NO:586)、RvOlOl(SEQ ID NO:15)、Rv0808(SEQ  ID NO:123)、RvO814c(SEQ ID NO:560)、Rv2153c(SEQ ID NO:309)、Rv2933 (SEQ ID NO:416)、Rv0071(SEQ ID NO:9)、Rv2471(SEQ ID NO:571)、 Rv2979c(SEQ ID NO:575)、RvO155(SEQ ID NO:556)、RvO581(SEQ ID  NO:559)、Rv2631(SEQ ID NO:377),Rv3455c(SEQ ID NO:489)、Rv3601c (SEQ ID NO:505)、RvO896(SEQ ID NO:562)、Rvl641(SEQ ID NO:234), Rv3005c(SEQ ID NO:427)、Rv3759c(SEQ ID NO:582)、Rv3800c(SEQ ID  NO:532)、RvO187(SEQ ID NO:30)、Rv2379c(SEQ ID NO:338)、Rv2434c(SEQ  ID NO:352)、Rv2940c(SEQ ID NO:574)、Rv3477(SEQ ID NO:580)、RvO435c (SEQ ID NO:72)、RvO844c(SEQ ID NO:128)、RvO856(SEQ ID NO:561)、 RvI 191(SEQ ID NO:564)、Rv2803(SEQ ID NO:397)、RvO783c(SEQ ID  NO:118)、RvlO54(SEQ ID NO:563)、Rvl689(SEQ ID NO:240)、Rv2539c(SEQ  ID NO:572)、Rv2859c(SEQ ID NO:573)、Rv3777(SEQ ID NO:528)。

根据具体的装置形式,所述装置抗原可以只含有可用于以自动化方式或 通过视觉观察而检测来自血液、血浆或血清或其他含有抗体的体液中的抗体 的结合的单一免疫优势抗原、片段或类似物。例如,在采用单一免疫优势抗 原的情况中,合适的装置可能处于试纸条或竞争性ELISA的形式。另一方 面,采用多种免疫优势抗原的情况中,合适的装置可能处于可以通过自动化 设备(例如,通过扫描仪)或者目测方式(例如,形成染料的比色反应)来读取 的阵列的形式。最典型的,在这类装置中,复数个抗原以空间可寻址方式布 置(例如,x-y矩阵或与颜色关联的柱子或者微量滴定板)。此外,应当指出 的是本文考虑的诊断装置可能基于许多已知的检测方式,包括ELISA(夹心 或不夹心的)、竞争性ELISA、抗独特型抗体等,其中所有已知的色度和光 度(例如,荧光、发光等)或放射反应被认为是适合使用的。

在最典型的装置中,单一(或多个)病原体和/或血清型的复数种免疫优势 抗原被布置在固体表面上或者可寻址的固相上,与血液、血清、血浆或其他 含有抗体的体液进行接触。因此,这样制备的组合物可以应用在识别和/或 表征个体对选定抗原的免疫反应,并且任选用于评估免疫反应类型(例如, 识别潜伏感染或慢性感染)以及疾病的进展、治疗疗效等。最典型的,复数 个抗原包括5至10个抗原,但也考虑明显更高数量的抗原,包括病原体蛋 白组的至少25%、通常至少50%、更典型的至少75%、最典型的至少90 %。类似地,少于5个抗原(1-4)也被认为是合适的。在发明主题的其他典型 方面,考虑的阵列最优选在微流体设备中处理。例如,这类装置中抗原阵列 被点在膜或其它材料(如不到1平方厘米的覆盖硝酸纤维的载体)上,然后被 放置在带有样品/试剂进口和出口的微流体设备中。根据具体的配置,可以 使用光学方法(例如CCD微阵列、平板扫描仪等)、电子方法(例如,伏安法 或安培法)或其他本领域已知方法来获取信号。替代地,目测或使用1200dpi 分辨率的常规平板扫描仪和/或荧光检测也被认为是合适的。

另一个例子中,符合发明主题的免疫优势抗原也可用于制备抗体制品, 制品可以作为被动免疫接种用于结核病的治疗。在优选实施方案中,这种疫 苗是亚基疫苗或减毒活重组疫苗。例如,本文提出的免疫优势抗原可应用于 制造疫苗,所述疫苗包含至少一个,更典型的是至少两个由SEQ ID NO:1 至SEQ ID NO:586的核酸编码的免疫优势抗原。但是更优选的设想疫苗包含 二至五个,或至少六个,甚至更多抗原,其中至少有一个抗原是免疫优势抗 原。这种疫苗组合物可用于引发对单个或多个亚型的免疫,因此可能包含不 同的优选来自多个不同亚型的免疫优势抗原。此外,应该理解,可能生产主 要甚至完全包含单一参数的免疫优势抗原。例如,疫苗可能包含潜伏性感染 群体所特有的免疫优势抗原。不太优选的方面,SEQ ID NO:1至SEQ ID  NO:586的序列也可以作为DNA疫苗,或者作为体内表达系统的一部分来 触发对体内产生的重组抗原或其片段的免疫反应。

此外,考虑了本文鉴定的抗原也可能用于产生(单克隆或多克隆)抗体或 其片段(例如,Fab、scFv等),而所述抗体或其片段则可以用于直接检测患 者血液、血液衍生物或其他体液中存在处于患者循环系统的抗原的诊断检 验。当然,应当理解,抗原可能与病原体联系在一起、与病原体成分联系在 一起、游离形式、或者与患者的分子或细胞结合地循环。最优选地,抗原是 如本文描述的免疫优势和/或血清诊断抗原。例如,合适的测试包括那些利 用一或多种标记抗体来检测体液中存在抗原的测试,其中抗原可以被(特异 地或与其他蛋白一起)留在表面上。本领域已知有许多抗原检测方法,所有 这些已知形式均被认为适用于本文。

在某些实施方案中,本发明的诊断工具涉及在体外细胞实验中确定从淋 巴细胞释放的细胞因子(比如干扰素γ)从而识别本文描述的免疫优势抗原, 所述淋巴细胞取自当前或以前感染了毒性分枝杆菌的受试对象。

对于疫苗的合适配制方法,应当认识到所有已知的生产这类疫苗的方式 都被认为适合用于本文,本领域普通技术人员能够很容易地生产此种疫苗, 而无需过多试验(参见例如,″Vaccine Adjuvants and Delivery Systems″by  Manmohan Singh;Wiley-Interscience(June 29,2007),ISBN:0471739073;或 者″Vaccine Protocols″(Methods in Molecular Medicine)by Andrew Robinson, Martin P.Cranage,and Michael J.Hudson;Humana Press;2edition(August 27, 2003);ISBN:1588291405)。因此,合适的疫苗可以配制成注射液、或悬浮液、 鼻内制剂、透皮或口服制剂。

本文描述的组合物、疫苗、诊断测试等等可以用于人用和兽用。

实施例

结核分枝杆菌蛋白质组微阵列的微阵列制造和探测方法:蛋白质组微阵 列按照以前的描述(Proc Natl Acad Sci U S A 102(3):547-552;Proteomics  7(10):1678-1686;Proteomics 7(13):2172-2183)经过改动而制作。这和本文讨 论的所有其他外在材料通过引用全文并入本文。凡所述并入参考文献中的定 义或名词的用法与本文提供的该名词的定义不一致或相冲突的情况,适用本 文提供的名词定义,而参考文献中的名词定义不适用。

结核分枝杆菌ORFeome的高通量构建:使用现有的结核分枝杆菌序列 数据为在基因组中编码的所有ORF设计引物对。使用PCR产物的凝胶电泳 进行质量控制。经过3轮PCR,最后结果(final tally)是97.3%被成功扩增。 为了克隆,将PCR产物与线性的基于pXT7的表达载体如前面所述进行混合, 并转化至高感受态的DH5α细胞中。转化细胞在37℃剧烈通气进行培养, 第二天检查浑浊度。过夜培养物不先经菌落挑选,用购自Qiagen的QIAprep  96 Turbo Miniprep试剂盒从中纯化DNA纯化。在3998个被成功扩增的PCR 产物中,3858个被克隆到pXi载体(96.5%的成功率)中。对随机抽样的1064 个克隆经“QC-PCR”测试,其中再次使用序列特异性引物来验证被克隆的插 入片段是预期大小。利用该技术证实了其中的1007个(94.6%)。

更具体地说,设计了4109个引物对来扩增结核分枝杆菌基因组 (Tuberculist(http://genolist.pasteur.fr/TubercuList/)中有注释)中的每一个 ORF(H37Rv株)。包含20bp基因特异性序列与33bp“接头”序列的定制PCR 引物用于PCR,以基因组DNA作为模板。对于>3KB的基因,设计额外的 引物对来扩增每3KB的重叠片段。用于这项工作的所有引物公布在UCI  Institute for Genomics and Bioinformatics(IGB)的网站http://contactl4.ics.uci  edu/virus/tuber_index.php。被并入扩增基因旁侧末端的接头序列与线性T7 表达载体pXT7的克隆位点同源,使得PCR产物能够在感受态DH5α细胞 中通过体内同源重组被克隆。由此产生的蛋白质结合了ATG翻译起始密码 子、5′多聚组氨酸表位、3′流感血凝素抗原表位和T7终止子。

阵列的制作:抗每个蛋白中经工程化带有的N-末端多聚His和C-末端 HA标签的抗体用于监测每个点上的表达。每个阵列中建立阳性和阴性对照, 阵列上剩余的点是体外转录/翻译反应,这些反应表达代表全部克隆 ORFeome的4109个不同结核分枝杆菌克隆。待RTS反应被点到硝酸纤维素 上并干燥后,在保干器中于18℃储存6个月后未观察到可察觉的降解(数 据未显示)。但是,在5小时体外蛋白表达结束后,观察到了与点样延迟相 关联的信号下降和信噪比降低。为了使这种下降最小化,体外表达反应交替 通过点样步骤.因此,通常优选反应在点样前不超过5小时、更优选不超过 3小时、最优选不超过1小时旧。用阳性和阴性对照如下所述将信号的其余 方差归一化。

微阵列以50-100个双板块基片(即,100-200个阵列)成批制作。高于阴性 对照强度平均值两个标准差作为标签检测的分界点。总体上,3854个(96.4%) 表达蛋白对HIS标签是阳性的,3730个(93.3%)对HA标签是阳性的,3538 个(91%)对两个标签都是阳性,只有56个(1.4%)对两个标签都是阴性,这意 味着98.6%的表达蛋白对至少一个标签是阳性的。

更详细地说,4109个(3998个全长ORFs加上111个>3kb的ORF区段) 克隆的纯化小份DNA抽提在购自Roche的基于大肠杆菌的体外转录/翻译表 达系统(RTS-100)中进行表达。在封闭的384孔板中准备10μl的体外反应, 于30℃在平台微型振荡器中300RPM温育5小时。然后加入终浓度0.05% 的Tween-20和蛋白酶抑制剂混合液(Complete,Roche)的混合物。为了减少蛋 白表达后点样延迟时间,交替开始RTS反应。RTS反应不经纯化用Omni Grid 100微阵列点样仪(Genomic Solutions)以单样品按4x 4亚阵列的形式点样 在双板块包被硝酸纤维素的FAST slides(Whatman)上,每个亚阵列包含17x 17个点。每个亚阵列包括6个阴性对照点,即含有缺少DNA模板的模拟 RTS反应。每个亚阵列包括小鼠、大鼠和人完整IgG的5个梯度稀释作为阳 性对照点。这些阳性和阴性对照一起用于给来自不同阵列的数据归一化(见 下文)。还包括的是纯化重组Epstein-Barr病毒核抗原-1(EBNA-I)的4个梯 度稀释,该抗原被大多数人识别,可以作为血清质量的有用指示。还点样的 是三个重组结核分枝杆菌蛋白38KDa(RvO934)、CFP-10(Rv3874(SEQ ID  NO:547))和ESAT-6(Rv3875(SEQ ID NO:548))。此外,购自Invitrogen (Carlsbad CA)的重组血管内皮生长因子(VEGF)和肿瘤坏死因子-α(TNF-α)的 6个梯度稀释点样,通过在某些血清样品中“偷偷加入”单克隆抗VEGF和抗 TNF-α抗体,上述点样可作为杂交对照。

为了用血清进行检测,将血清在Low Cross Dilution Buffer(Candor  Bioscience)中1/200稀释,所述稀释缓冲液含有终浓度4-5mg/ml蛋白质的 大肠杆菌裂解物。稀释液于室温保温30分钟并不断混匀以阻止抗大肠杆菌 的抗体。阵列在封闭缓冲液(Candor Bioscience)中重新水合30分钟,用预 先处理过的血清于4℃不断搅拌地过夜探测。然后将基片在含有0.05%(v/v) Tween 20,(T-TBS)的三羟甲基氨基甲烷(Tris)-缓冲盐中洗5次,温育在用稀 释缓冲液1/400稀释过的生物素化抗人Fc(Jackson Immuno Research)中。在 T-TBS中将每个基片清洗3次后,通过与偶联链霉亲和素的SureLightP-3 (Columbia Biosciences)温育使结合的抗体可见。然后将基片各在T-TBS中然 后在TBS中洗3次,在经短暂离心干燥前插入蒸馏水。通过以单克隆抗多 聚组氨酸(clone His-1,Sigma)和抗血凝素(clone 3F10,Roche)进行探测,分别 使用生物素化的抗小鼠和抗大鼠二抗,然后是偶联链霉亲和素的SureLightP-3,从而监测点样阵列上的蛋白表达。

人血清:血清获得自全球几个TB流行区的临床点的927名患者,使用 类似群体设计(cohorts design)包括了有提示TB的呼吸系统症状的个体(TB怀 疑者)。活动性TB的诊断是根据患者痰中有结核分枝杆菌生长作出的(培养 物证实的活动性TB)(n=403)。非TB疾病的诊断是根据完整微生物学和X 光胸透研究作出的(n=418)。包括在非TB病例中的是未根据经验进行TB 治疗的那些和接受了足够的通过症状筛选(有时包括CXR)进行的后续检查 来排除TB的那些患者。有时不清楚BCG接种状态,但群体都来自出生时 全民接种BCG的国家。对于数据分析,活动性TB病例划分为涂片阳性TB (痰中存在结核分枝杆菌)和涂片阴性活动性TB。TB和非TB疾病组的病例 还根据HIV合并症进行了再次划分。阴性对照血清(n=42)从非流行区国家(意 大利)的健康无症状个体获得,所述个体通过结核菌素皮试、Quantiferon检 验和结核病ELISPOT(T-spot)检验证实是潜伏TB感染(LTBI)阴性的。后一 组供体的BCG接种状态未知,但一般来说流行区国家的个体接种,而非流 行区国家的个体不接种。

数据获取:用GenePix Autoloader 4200AL微阵列共聚焦激光扫描仪 (Molecular Devices)对基片进行扫描。利用GenePix Pro 6.0软件(Molecular  Devices)由被探测阵列的扫描tiff图像文件量化样品点的像素强度中值。

通过蛋白组学特征和功能对免疫反应性抗原进行分类:按照 TubercuList上注释的功能分类代码将抗原分类,还利用SignalP(J MoI Biol  340(4):783-795)和PSORTb(Bioinformatics 21(5):617-623)(http://db.psort.org) 进行了计算预测来分别预计信号肽的存在概率和细胞定位。

筛选蛋白组中的血清诊断抗原:用每组血清探测过的代表性阵列如图 1A和1B所示。图板(A)显示培养物证实的TB阳性个体,图板(B)显示潜 伏性TB感染的阴性对照个体。每个阵列都含有阳性和阴性对照点。IgG对 照点(用于二抗的对照)在两个阵列中都是阳性的。两组个体都不对阴性(无 DNA)对照反应发生反应。两组个体都对EBNA-I有反应,表明以前接触过 EBV,急性感染的个体组对多个结核分枝杆菌抗原有强烈的抗体反应。

对阵列的一个评估是通过计算高于对照(无DNA)信号的平均+2SD(“没 有DNA”)的临界值进行的。按这个标准,可以注意到来自TB阳性和对照个 体的血清均对阵列上的抗原有反应。然而,即使通过目测也很明显,TB证 实患者比对照对抗原的反应更为激烈并且抗更多抗原。为了确认看到的结核 分枝杆菌抗原信号是否是未能成功封闭的大肠杆菌的特异性抗体,大肠杆菌 裂解物的浓度。但是,这对信号没有影响(数据未显示)。还包括了由结核分 枝杆菌制备的裂解物,结果完全消除了阵列上的所有信号(数据未显示),这 表明阵列上看到的信号是由于血清中的结核分枝杆菌特异性抗体。

蛋白微阵列数据分析:

微阵列数据通过四种方法进行了分析,总结如下。Log 10转换的数据用 于前三种方法,VSN-归一化的数据用于第四种方法。图4A显示TB病例 (n=400)和非TB病例(n=418)之间的比较中,三种分析方法(随机森林、CERNO 和CERNO预过滤数据的随机森林)的至少一种方法中蛋白排名<10。每个方 法中蛋白的相对排名(最大排名-4000)如图示。N/A(不存在),表明蛋白被 CERNO预过滤(过滤的p值>0.005)。图4B显示图4A相同的内容,但是仅 有HIV阴性人员中的TB病例(n=255)与非TB病例(n=307)的比较。

1.TB和非TB样品通过随机森林,一种基于多个分类树的分类方法来 进行分类。随机森林查询(TB对非TB病例的比较)是对从来自流行区国家的 血清收集到的数据,和根据HIV状态和TB患者的涂片状态分层的数据进行 的。根据具体查询的精确性输出的平均下降将抗原从最能提供信息到最不能 提供信息排名(最高的精确性平均下降对应最高排名)。用CERNO统计计算 经过或者不经过预过滤步骤进行随机森林分析。

2.CERNO p值提供了高相对强度与活动性结核病诊断之间的关联。抗 原按照逐渐下降的p值排名。

3.还通过以下顺序计算,对数据进行了分析以便鉴定相对非TB疾病样 品,在TB样品中显示出异常高的结合的抗原:(i)来自流行病区的非TB样 品中的每个抗原的平均值和方差;(ii)一个比较(来自流行病国家的TBvs非TB 疾病)中每个样品的每个抗原的Z得分(非TB疾病类别中的抗原与均值的标 准偏差数);(iii)Z得分对应的p值(该值以上的预期正态分布尾区);(iv)每个文 档调整后的P-值(Benjamini Hochberg);(v)在0.01的p调整水平(百分之一的假 发现率)的反应性vs无反应性。抗原按照TB组中反应性调用的数量排名。

4.为了稳定原始数据的方差,使用了变种的log转换(asinh) (Bioinformatics 20(5):660-667),利用Bioconductor suite (http://Bioconductor.org/)中R的“VSN”软件包,阴性和阳性对照点(分别是“无 DNA”和IgG点)被用来对数据归一化。利用由Cyber-T改进的用于蛋白组阵 列的Bayes调节性t-检验(Bioinformatics 17(6):509-519;J Biol Chem 276(23): 19937-19944;Bioinformatics 22(14):1760-1766;Bioinformatics 23(13): 1508-518),通过比较证实的TB阳性组和LTBI-阴性对照组的信号,得到归 一化后数据的p值。为了判断多重检验条件,计算了Benjamini Hochberg p 值调整。分别具有Benjamini Hochberg校正p值<0.05或>0.05,并且平均信 号强度超过涂片阳性样品上阴性对照点(无DNA)均值2个标准差的反应性抗 原被定义为血清诊断的或交叉反应的。利用Support Vector Machines(SVMs) 建立了多个抗原分类器。R中的″elO71″和″ROCR″包分别被用于训练 SVMs,和生成接受器操作特性(receiver operating characteristic,ROC)曲线。 对于其他图示,比如热图和直方图,归一化数据被重新转换为大概的原始数 值。

利用上述方法,通过结合对所有TB和非TB疾病患者、所有HIV阴性 TB和非TB疾病患者进行的查询的随机森林(RF)和CERNO中前50排名, 加上对HIV阳性TB和非TB疾病查询的前10排名,加上TB类别中反应性 调用>3,加上Benjamini Hochberg调整的Cyber T p值<0.05,总共挑选到250 个抗原。根据这些方法的协议,将7组抗原评定优先级,其中第一组的抗原 最优选。

最优选的抗原编码序列通过RF或CERNO(p<0.005)加上反应性调用, RF(<10)和CERNO(p<0.005),以及Benjamini Hochberg调整的Cyber T p 值<0.05表征:RvO798c(SEQ ID NO:121)、Rvl886c(SEQ ID NO:270)、 Rv2031c(SEQ ID NO:284)、Rv3616c(SEQ ID NO:509)、Rv3804c(SEQ ID  NO:534)、Rv3874(SEQ ID NO:547)。

以下抗原产生序列被确定为第二最优选,通过RF或CERNO(p<0.005) 加上反应性调用,RF(<10)和CERNO(p<0.005)表征:Rv0302(SEQ ID  NO:52)、RvO379(SEQ ID NO:65)、Rv0394c(SEQ ID NO:66)、RvO456c(SEQ  ID NO:74)、RvO632c(SEQ ID NO:103)、RvO944(SEQ ID NO:142)、RvO984 (SEQ ID NO:146)、Rvl030(SEQ ID NO:153)、RvI 196(SEQ ID NO:174)、 Rvl242(SEQ ID NO:180)、Rvl284(SEQ ID NO:187)、Rvl387(SEQ ID  NO:206)、RvI 837c(SEQ ID NO:264)、Rvl926c(SEQ ID NO:275)、Rvl980c (SEQ ID NO:281)、Rv2094c(SEQ ID NO:294)、Rv2544(SEQ ID NO:363)、 Rv2618(SEQ ID NO:375)、Rv2746c(SEQ ID NO:391)、Rv2870c(SEQ ID  NO:407)、Rv2873(SEQ ID NO:408)、Rv2875(SEQ ID NO:409)、Rv3050c(SEQ  ID NO:434)、Rv3248c(SEQ ID NO:458)、Rv3376(SEQ ID NO:478)、Rv3763 (SEQ ID NO:527)、Rv3810(SEQ ID NO:536)、Rv3864(SEQ ID NO:545)。

以下抗原产生序列被确定为第三最优选的,通过Benjamini Hochberg调 整的Cyber T p值<0.05表征:Rv2252(SEQ ID NO:323)、Rv2282c(SEQ ID  NO:569)、RvO212c(SEQ ID NO:557)、Rv3243c(SEQ ID NO:456)、Rv3675 (SEQ ID NO:519)、Rv2984(SEQ ID NO:423)、RvI 175c(SEQ ID NO:169)、 Rv3326(SEQ ID NO:578)、Rv3628(SEQ ID NO:513)、Rv3775(SEQ ID  NO:584)、Rv3362c(SEQ ID NO:475)、Rv0801(SEQ ID NO:122)、Rvl629(SEQ  ID NO:566)、RvO272c(SEQ ID NO:558)、Rv3762c(SEQ ID NO:583)、Rv3319 (SEQ ID NO:577)、Rv3495c(SEQ ID NO:581)、Rv2151c(SEQ ID NO:308)。

以下抗原产生序列被确定为第四最优选的,通过反应性调用表征: RvO227c(SEQ ID NO:37)、Rv0280(SEQ ID NO:50)、RvO993(SEQ ID NO: 148)、Rvl306(SEQ ID NO:192)、Rvl363c(SEQ ID NO:204)、Rv2050(SEQ ID  NO:288)、Rv2116(SEQ ID NO:299)、Rv3417c(SEQ ID NO:486)、Rv3653(SEQ  ID NO:516)。

以下抗原产生序列被确定为第五最优选的,通过CERNO或RF排名<10 表征:Rv1253(SEQ ID NO:182)、Rv3413c(SEQ ID NO:485)、Rvl635c(SEQ  ID NO:232)、Rv3021c(SEQ ID NO:432)、RvI 193(SEQ ID NO:173)、Rv2592c (SEQ ID NO:369)、Rv3620c(SEQ ID NO:510)、RvO929(SEQ ID NO:139)、 RvO959(SEQ ID NO:145)、RvI 162(SEQ ID NO:166)、Rv2389c(SEQ ID  NO:341)、Rv2984(SEQ ID NO:423)、Rv2588c(SEQ ID NO:367)、RvO171 (SEQ ID NO:26)、RvI 865c(SEQ ID NO:267)、Rv2074(SEQ ID NO:290)。

以下抗原产生序列被确定为第六最优选的,通过CERNO或RF排名<25 表征:RvO543c(SEQ ID NO:87)、Rvl677(SEQ ID NO:237)、Rvl304(SEQ ID  NO:191)、Rv2841c(SEQ ID NO:400),Rv3680(SEQ ID NO:520)、RvO831c (SEQ ID NO:125)、Rv2032(SEQ ID NO:285)、Rv3127(SEQ ID NO:446), Rv3272(SEQ ID NO:464)、Rv3323c(SEQ ID NO:470)、Rv3508(SEQ ID  NO:494)、Rv3628(SEQ ID NO:513),RvI 173(SEQ ID NO:167)、Rv2623(SEQ  ID NO:376)、RvO527(SEQ ID NO:85)、Rvl620c(SEQ ID NO:229),Rvl901 (SEQ ID NO:272)、Rv2151c(SEQ ID NO:308)、Rv0362(SEQ ID NO:60)、 Rv3129(SEQ ID NO:447),Rv3140(SEQ ID NO:449)、Rv0340(SEQ ID  NO:56)、Rv2792c(SEQ ID NO:395)、Rv3003c(SEQ ID NO:426)、Rv3019c (SEQ ID NO:431)、Rv3862c(SEQ ID NO:544)、RvO572c(SEQ ID NO:91)、 Rv2477c(SEQ ID NO:356)、Rv2659c(SEQ ID NO:379)、RvO311(SEQ ID  NO:54)、Rv0350(SEQ ID NO:57)、Rv2127(SEQ ID NO:301)、Rv3875(SEQ ID  NO:548)、RvO877(SEQ ID NO:134)、Rvl916(SEQ ID NO:274)、Rv2138(SEQ  ID NO:303)、Rv2847c(SEQ ID NO:403)、Rv3118(SEQ ID NO:444)、Rv2495c (SEQ ID NO:358)、Rv3669(SEQ ID NO:517)、RvO281(SEQ ID NO:51)、 Rv2711(SEQ ID NO:383)、Rv2744c(SEQ ID NO:390)、Rv3803c(SEQ ID  NO:533)、Rvl239c(SEQ ID NO:179)、Rv2147c(SEQ ID NO:307)、Rv2253 (SEQ ID NO:324)、Rv0308(SEQ ID NO:53)、RvO587(SEQ ID NO:95)、 Rvl564c(SEQ ID NO:224)、Rv2185c(SEQ ID NO:313)。

以下抗原产生序列被确定为第七最优选的,通过CERNO或RF排名在 26到50之间表征:RvI805c(SEQ ID NO:261)、Rv2729c(SEQ ID NO:386)、 Rv3386(SEQ ID NO:481)、Rv3515c(SEQ ID NO:497)、RvO772(SEQ ID  NO:116)、Rv2948c(SEQ ID NO:420)、Rv0006(SEQ ID NO:1)、Rvl906c(SEQ  ID NO:273)、Rv2244(SEQ ID NO:322)、Rv2468c(SEQ ID NO:354)、Rv3701c (SEQ ID NO:522)、Rv0054(SEQ ID NO:6)、Rvl945(SEQ ID NO:277)、Rv3345c (SEQ ID NO:472)、RvO276(SEQ ID NO:48)、Rv0709(SEQ ID NO:108)、 Rvl527c(SEQ ID NO:220)、Rv2048c(SEQ ID NO:287)、Rv2414c(SEQ ID  NO:345)、Rv3524(SEQ ID NO:499)、Rv3556c(SEQ ID NO:502)、Rvl322(SEQ  ID NO:196)、Rv2934(SEQ ID NO:417)、Rv0270(SEQ ID NO:47)、RvO612 (SEQ ID NO:99)、Rvl699(SEQ ID NO:242)、Rv2728c(SEQ ID NO:385)、 Rv3017c(SEQ ID NO:430)、Rv3364c(SEQ ID NO:476)、Rv3418c(SEQ ID  NO:487)、Rv3718c(SEQ ID NO:525)、RvO426c(SEQ ID NO:70)、RvI181(SEQ  ID NO:171)、Rvl725c(SEQ ID NO:250)、RvO256c(SEQ ID NO:44)、Rv0605 (SEQ ID NO:98)、RvO737(SEQ ID NO:114)、RvO834c(SEQ ID NO:126)、 Rvl255c(SEQ ID NO:184)、Rv2224c(SEQ ID NO:320)、RvI843c(SEQ ID  NO:265)、Rv2333c(SEQ ID NO:334)、Rv2490c(SEQ ID NO:357)、Rv3183 (SEQ ID NO:454)、RvO668(SEQ ID NO:106)、Rvl556(SEQ ID NO:223)、 Rvl673c(SEQ ID NO:236)、Rv3513c(SEQ ID NO:496)、Rv3675(SEQ ID  NO:519)、Rv3870(SEQ ID NO:546)、Rv3891c(SEQ ID NO:552)、RvO163 (SEQ ID NO:24)、Rv0710(SEQ ID NO:109)、Rvl297(SEQ ID NO:189)、 Rvl745c(SEQ ID NO:255)、Rv0600c(SEQ ID NO:97)、Rvl536(SEQ ID  NO:222)、Rvl738(SEQ ID NO:254)、Rv2524c(SEQ ID NO:359)、Rv3086(SEQ  ID NO:440)、Rv3367(SEQ ID NO:477)、RvO135c(SEQ ID NO:20)、RvO627 (SEQ ID NO:101)、Rvl448c(SEQ ID NO:213)、Rv3224a(SEQ ID NO:455)、 Rv0029(SEQ ID NO:2)、RvO846c(SEQ ID NO:129)、RvI159(SEQ ID  NO:165)、RvI186c(SEQ ID NO:172)、Rvl705c(SEQ ID NO:243)、Rvl713(SEQ  ID NO:248)、Rv2476c(SEQ ID NO:355)、Rv3402c(SEQ ID NO:483)、Rv2615c (SEQ ID NO:374)、Rv2995c(SEQ ID NO:425)、Rv3788(SEQ ID NO:585)、 Rv0140(SEQ ID NO:555)、Rv0203(SEQ ID NO:33)、Rvl531(SEQ ID  NO:565)、Rvl693(SEQ ID NO:241)、Rvl882c(SEQ ID NO:269)、Rv2143(SEQ  ID NO:568)、Rv2367c(SEQ ID NO:570)、RvO584(SEQ ID NO:94)、Rvl651c (SEQ ID NO:567)、Rv3197a(SEQ ID NO:576)、Rv3369(SEQ ID NO:579)、 Rv3825c(SEQ ID NO:586)、RvOlOl(SEQ ID NO:15)、Rv0808(SEQ ID  NO:123)、RvO814c(SEQ ID NO:560)、Rv2153c(SEQ ID NO:309)、Rv2933 (SEQ ID NO:416)、Rv0071(SEQ ID NO:9)、Rv2471(SEQ ID NO:571)、 Rv2979c(SEQ ID NO:575)、RvO155(SEQ ID NO:556)、RvO581(SEQ ID  NO:559)、Rv2631(SEQ ID NO:377)、Rv3455c(SEQ ID NO:489)、Rv3601c (SEQ ID NO:505)、RvO896(SEQ ID NO:562)、Rvl641(SEQ ID NO:234)、 Rv3005c(SEQ ID NO:427)、Rv3759c(SEQ ID NO:582)、Rv3800c(SEQ ID  NO:532)、RvO187(SEQ ID NO:30)、Rv2379c(SEQ ID NO:338)、Rv2434c(SEQ ID NO:352)、Rv2940c(SEQ ID NO:574)、Rv3477(SEQ ID NO:580)、RvO435c (SEQ ID NO:72)、RvO844c(SEQ ID NO:128)、RvO856(SEQ ID NO:561)、 RvI 191(SEQ ID NO:564)、Rv2803(SEQ ID NO:397)、RvO783c(SEQ ID  NO:118)、RvlO54(SEQ ID NO:563)、Rvl689(SEQ ID NO:240)、Rv2539c(SEQ  ID NO:572)、Rv2859c(SEQ ID NO:573)、Rv3777(SEQ ID NO:528)。

在其他方法中,为了鉴定血清诊断抗原,给每个反应性抗原进行了t-检 验对TB病例与对照的归一化信号强度进行比较,示范性结果如图2A所示。 这里Cyber T-检验揭示23个抗原的信号在涂片阳性TB病例(n=13)和LTBI 阴性对照(n=69)之间是显著不同的。这些抗原根据它们在两个患者组的归一 化信号强度平均值显示在直方图中,并且根据在涂片阳性组中信号逐渐下降 的顺序排名。还显示了每个抗原的p-值(顶端),排列成较重要的抗原产生向 下的尖端。

基于来自48个LTBI阴性受试对象和50个TB培养物阳性受试对象的 探测血清,总共发现了31种抗原来区分这些组,如图2B所示被认为是血清 诊断性的。还发现多种抗原的联用产生特异性和灵敏度提高的测试。最佳的 2种区分抗原的AUC>0.88,分类器中再加入3种抗原使AUC评分提高到 >0.90。使用10种抗原产生>0.93的AUC评分。奇特的是,再加入抗原不会 提高分类器的AUC评分。对于这项研究中的血清,最佳的10种区分抗原 产生>80%的鉴定真阴性的灵敏度,和>90%的鉴定真阳性的灵敏度。这些结 果清楚地支持了利用ORFeomes(采用无酶重组克隆产生的)的全蛋白质组微 阵列和利用基于大肠杆菌的无细胞表达系统表达的蛋白质组作为发现血清 诊断抗原的有利工具的能力。这些分类器将得益于对特性已知的血清样品更 大量更广泛的研究。

发明人然后利用接受器操作特性(ROC)曲线研究了不同数量ORF的诊 断能力。ROC曲线是分类器中随着区分阈值变化,假阳性率(1-特异性)vs 真阳性率(灵敏度)的参数图。曲线下的面积(AUC)总结了结果。根据Truchon 和Bayly(J Chem Inf Model 47(2):488-508)的方法推断,AUC为1.0表示完美 的分类器,而AUC为0.51(95%置信区间,0.43到0.59)是对数据组随机发 挥作用的分类器的预期值。对于多种抗原,使用了Kernel方法和支持向量机 (support vector machines)(Bioinformatics:the Machine Learning Approach, Second Edition edn.:MIT Press)来建立线性和非线性分类器。根据p值或单一 抗原AUC的排名最高的1、2、5、10和30个ORF被用做分类器的输入, 结果经10轮3倍交叉验证证实。结果(数据未显示)显示将抗原数量从1增加 到5,和从5增加到10产生了分类模式的渐进式提高。增加数量超过这个 范围不能提高算法区分两个群体的能力。根据这些数据建立的列联表 (Contingency tables)显示在最佳阈值使用10种抗原对于真阳性给出94%的准 确度,真阴性的准确度78%。

替代地,还如下进行了抗原选择:原始数据被分布到两个查询组,在对 照点上利用vsn将子集归一化。对归一化后的数据进行Cyber T检验,用前 几位抗原子集建立SVM分类器。去掉重复。每个样品包含了元数据用于建 立10个查询中的每一个,每个组是原始数据的不相交子集,每个查询只有 两个组。数据用Arsinh Normalization(Bioinformatics,18 Suppl 1,2002)进行归 一化,以补偿方差对均值的依赖性。对每个样品进行affine-线性转换(scale 所有数值+add数值)来补偿样品间的位移,从而可以对归一化后的数据进行 t-检验。Cyber T检验用于利用相邻点来估计某点的方差(Bioinformatics, 17(6):509-519,2001),给出对于特定抗原两组之间均值的差别的统计度量。 对p值取子集:根据p值的限制性给抗原取子集。使用了多重检验校正,多 数情况中根据Bonferroni或Benjamini-Hochberg p值(<.O5)给抗原取子集。 建立(SVM)分类器:利用多个排名靠前的抗原建立分类器从而提供对每个 查询所能达到的分类准确度的估计。这使得能够确定最终的分类器中包括的 最佳抗原数量。使用3倍交叉检验,产生ROC曲线来显现结果。图2C显示 的血清诊断性抗原列表中提供了利用这项分析获得的示范性结果。

富集分析:为了确定免疫优势抗原集中富集的蛋白的特性,将蛋白根据 TubercuList基因组数据库(http://genolist.pasteur.fr/TubercuList/)分到11个功 能类别之一中。确定免疫优势抗原集每个类别的“命中”数量。7个免疫优势 抗原被认为是血清诊断性的,其中4个(57.1%)是含有脯氨酸-谷氨酸 (PE/PPE)基元的蛋白质。因为整个蛋白质组含有168个(4.2%)PE/PPE基元 蛋白质,这代表了相对整个蛋白质组显著的13.6倍的富集。重要的是,167 个“交叉反应性”免疫优势抗原对任何功能类别都没有显著富集。如果不考虑 免疫优势性对所有抗原进行评估,血清诊断性抗原的数量可以增加到31。 这其中6个(19.4%)是毒性因子,10个(32.2%)是PE/PPE基元蛋白质,代 表相对整个蛋白质组两种都是显著的7.7倍富集。有趣的是,参与中间代谢 的分子相对整个蛋白质组在血清诊断集中显著未被充分代表(0.1倍富集)。

还进行了几项技术预测来给抗原分类。脂蛋白和细胞壁蛋白未在血清诊 断抗原集中富集,而拥有信号序列或PSORTb分类的胞外蛋白被富集。高卷 曲含量、高甘氨酸和高脯氨酸都是富集特征。描述为具有100-200个氨基酸 长的高度保守脯氨酸富集基元且在N末端有高卷曲含量的PE/PPE分子是显 著的富集特征。血清诊断抗原集的31个分子中的26个带有负电荷,等电点 <6.7。同样这些预测的特征在交叉反应抗原集中都没有富集。

结合抗体的荧光和比色检测的比较:对于荧光扫描仪不现实或者最好能 使用较小的装置的情况,比如高危实验室或者常规诊断实验室,能够用比色 方法学替代荧光检测将促进阵列的更广泛应用。但是,不知道与荧光相比, 比色读数是否灵敏度或动态范围较低。为了这个目的,用合适的偶联碱性磷 酸酶的二抗使HIS和HA标签特异性单克隆抗体显现,并用nitro-TB  developer将阵列显影。利用常规的桌面文件扫描仪获得灰度2400dpi分辨率 的TIFF图像,4608个数据点的散点图与荧光检测进行了比较。HIS和HA 标签的信号相关性很高(r2分别=0.8186和0.9259)。基于荧光的检测对多聚 His标签的检测、HA标签的检测、两种标签的检测和没有检测到标签分别 是99.2%、97.0%、96.6%和0.4%。基于比色的检测对多聚His标签的检测、 HA标签的检测、两种标签的检测和没有检测到标签分别是93.7%、88.6%、 84.8%和2.5%。虽然基于荧光的检测似乎更灵敏(因为“双阴性”较少),基于 碱性磷酸酶的检测方法是质量相当的替代方法,只需基本仪器即可进行。图 3显示了用(A)HIS的抗体和(B)HA标签抗体来探测、并通过荧光和比色手 段显现的阵列代表性扫描;散点图是比色相对于(vs.)荧光数据。

其他示范性的方法和方案在专利申请PCT/US07/23299(以 WO2008/140478公开)中有提供,该申请通过引用并入本文。

综上所述,我们公开了与结核分枝杆菌抗原相关的组合物和方法的具体 实施方案和应用。但对本领域技术人员来说,很显然除了已经描述的,在不 背离本文的发明理念的情况下还有许多改进都是可能的。因此除了随附权利 要求的精神以外,发明主题不应受到限制。并且,在解释说明书和权利要求 时,所有的名词都应当按照与上下文语境一致的尽可能宽泛的方式来解释。 尤其是名词“包含”(″comprises″和″comprising″)应当解释为是指非排除性的 元件、成分或步骤,表明提及的元件、成分或步骤可能与其他没有明确提出 的元件、成分或步骤一起存在、或使用或组合。此外,凡所述并入参考文献 中的定义或名词的用法与本文提供的该名词的定义不一致或相冲突的情况, 适用本文提供的名词定义,而参考文献中的名词定义不适用。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号