首页> 中国专利> 用于肺癌诊断的复合生物标志物群、肺癌诊断用试剂盒、利用其的信息的方法及计算系统

用于肺癌诊断的复合生物标志物群、肺癌诊断用试剂盒、利用其的信息的方法及计算系统

摘要

本发明公开用于对受试者进行肺癌诊断的复合生物标志物群、利用它的肺癌诊断用试剂盒及用于对受试者进行复合生物标志物群信息利用方法。该复合生物标志物群包含独立的生物标志物CEA、HE4、ApoA2、TTR、sVCAM‑1和RANTES,该肺癌诊断用试剂盒包含与独立的生物标志物CEA、HE4、ApoA2、TTR、sVCAM‑1和RANTES进行特异性结合的抗体。肺癌诊断用试剂盒包括:至少六个容纳区域;以及六种以上的抗生物标志物抗体,其分别容纳在上述至少六个容纳区域的每一个中,并与已设定的独立的生物标志物进行特异性结合,上述六种以上的抗生物标志物抗体包括分别与独立的生物标志物CEA、HE4、ApoA2、TTR、sVCAM‑1和RANTES进行特异性结合的抗体。还提供肺癌诊断用复合生物标志物群信息利用方法及执行它的计算系统。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-05-05

    授权

    授权

  • 2018-05-29

    著录事项变更 IPC(主分类):G01N33/574 变更前: 变更后: 申请日:20160907

    著录事项变更

  • 2018-04-06

    实质审查的生效 IPC(主分类):G01N33/574 申请日:20160907

    实质审查的生效

  • 2018-03-13

    公开

    公开

说明书

技术领域

本发明涉及用于对受试者进行肺癌诊断的复合生物标志物群、利用它的肺癌诊断用试剂盒、利用复合生物标志物群的信息的方法及执行它的计算系统,其中,本发明的复合生物标志物群用于诊断肺癌,包括独立的生物标志物CEA、HE4、ApoA2、TTR、sVCAM-1和RANTES。

背景技术

肺癌为产生于肺的癌症,全世界上每年有130万名以上人因肺癌而死亡,在由癌症引起的死亡中占据最高的比率。肺癌的主要原因为吸烟、氡气、石棉和遗传等,其中,已知吸烟所占比重最高。

对肺癌进行具体分类,肺癌分为小细胞肺癌(small cell lung cancer)和非小细胞肺癌(non-small cell lung cancer)。其中,非小细胞肺癌为最具代表性的癌症且占肺癌的约80%,分为腺癌(adenocarcinoma)、鳞状细胞癌(squamous cell carcinoma)和大细胞癌(large cell carcinoma)。根据肺癌的种类,不仅在组织学特性上存在差异,而且在预后和治疗方法上也呈现出差异,因此准确诊断很重要。在非小细胞肺癌的情况下,尽管最近的癌症治疗方法取得了发展,十年生存率仍然非常低且为10%以下。其原因在于,即使在大部分非小细胞肺癌相当多的时期,也难以诊断患者得了肺癌。

肺癌具有如下的典型特征:在肺癌早期完全没有症状,发展到某一程度之后也停留在类似普通感冒的咳嗽、喀痰程度的症状,从而诊断非常困难,无法通过普通门诊发现,即便是相同的肺癌也根据癌症的发生位置显示不同的症状。作为肺癌的一般症状,具有咳嗽、带血痰或咳血、呼吸困难、胸部疼痛、沙哑声音、上腔静脉综合征、骨头疼痛和骨折、头痛、恶心、呕吐等,当患者自己意识到这种症状的表现开始严重时,应视为肺癌已经发展到不小的程度的状态。

因此,目前肺癌早期诊断为提高患者的生存可能性的最佳方法。

用于早期诊断肺癌的最佳方法为周期性检查。在这种检查时,提取来源于患者的血液、小便等患者身体的生物样本,由此能够判断肺癌的发病与否。如此,将能够利用包含在生物样本中的蛋白质、核算、代谢物质等来获知体内变化的指标称作生物标志物(biomarker)。

例如,如韩国授权专利第10-1463588号所公开,在用于早期诊断肺癌的现有的生物标志物技术中,必须包含有A1AT(α-1蛋白酶抑制剂)、IGF-1(胰岛素样生长因子1)、RANTES和TTR。如果能够用优于该技术的分类能力来诊断出肺癌,即,如果由生物标志物引起的误诊更少,则有利于肺癌确诊所需的时间、费用和效果等方面。

[现有技术文献]

[专利文献]

专利文献1:KR10-1463588B

发明内容

技术问题

本发明的目的在于提供一种用于诊断肺癌的、进一步得到改进的复合生物标志物。

技术手段

用于达到如上所述的本发明的目的并实现本发明的特征效果的本发明的特征结构如下所述。

根据本发明的一方面,提供一种用于对受试者进行肺癌诊断的复合生物标志物群,其中,该复合生物标志物群包含独立的生物标志物CEA(Carcinoembryonic antigen,癌胚抗原)、HE4(Human Epididymis Protein 4,人附睾蛋白4)、ApoA2(Apolipoprotein A-II,载脂蛋白A-II)、TTR(Transthyretin,转甲状腺素蛋白)、sVCAM-1(soluble vascularcell adhesion molecule-1,可溶性血管细胞黏附分子-1)和RANTES{regulated onactivation,normal T cell expressed and secreted;Chemokine(C-C motif)ligand 5}(调节活化的正常T细胞表达和分泌因子,也叫作趋化因子配体5)。

根据本发明的另一方面,提供一种为了对受试者进行肺癌诊断而利用复合生物标志物群的肺癌诊断用试剂盒,其中,该肺癌诊断用试剂盒包含与独立的生物标志物CEA、HE4、ApoA2、TTR、sVCAM-1和RANTES进行特异性结合的抗体。

根据本发明的又一方面,提供一种应用用于对受试者进行肺癌诊断的复合生物标志物群的肺癌诊断用试剂盒,其中,该肺癌诊断用试剂盒包括:至少六个容纳区域;以及六种以上的抗生物标志物抗体,其容纳在上述至少六个容纳区域的每一个中,并与已设定的独立的生物标志物进行特异性结合,其中,上述六种以上的抗生物标志物抗体包括分别与各个独立的生物标志物CEA、HE4、ApoA2、TTR、sVCAM-1和RANTES进行特异性结合的抗体。

根据本发明的另一方面,提供一种为了对受试者进行肺癌诊断而利用复合生物标志物群的信息的方法,该方法包括以下步骤:(a)计算系统获取(1-i)从由肺癌患者和非肺癌患者的人群构成的样本群的生物样本中测定到的肺癌诊断用复合生物标志物群的每个独立的生物标志物的表达量数据、或者(1-ii)从上述样本群中测定到的上述每个独立的生物标志物的表达量数据和上述样本群的年龄,并对上述样本群的上述每个独立的生物标志物的表达量数据进行前处理,在(2-i)从作为上述经前处理的数据的上述样本群的测定数据、或者(2-ii)从上述样本群的测定数据和上述样本群的年龄导出肺癌判断模型的状态下,获取(3-i)从上述受试者的生物样本中测定到的上述肺癌诊断用复合生物标志物群的每个独立的生物标志物的表达量数据、或者(3-ii)从上述受试者中测定到的上述每个独立的生物标志物的表达量数据和上述受试者的年龄;以及(b)上述计算系统对上述受试者的上述每个独立的生物标志物的表达量数据进行前处理,并利用(4-i)作为上述经前处理的数据的上述受试者的测定数据、或者(4-ii)上述测定数据和上述受试者的年龄,从上述肺癌判定模型判定上述受试者的肺癌发病与否,其中,上述肺癌诊断用复合生物标志物群包含独立的生物标志物CEA、HE4、ApoA2、TTR、sVCAM-1和RANTES。

根据本发明的又一方面,提供一种为了对受试者进行肺癌诊断而利用复合生物标志物群的信息的计算系统,该利用复合生物标志物群的信息的计算系统包括:通信部,获取(1-i)从由肺癌患者和非肺癌患者的人群构成的样本群的生物样本中测定到的肺癌诊断用复合生物标志物群的每个独立的生物标志物的表达量数据、或者(1-ii)从上述样本群中测定到的上述每个独立的生物标志物的表达量数据和上述样本群的年龄,并对上述样本群的上述每个独立的生物标志物的表达量数据进行前处理,在(2-i)从作为上述经前处理的数据的上述样本群的测定数据、或者(2-ii)从上述样本群的测定数据和上述样本群的年龄导出肺癌判断模型的状态下,获取(3-i)从上述受试者的生物样本中测定到的上述肺癌诊断用复合生物标志物群的每个独立的生物标志物的表达量数据、或者(3-ii)从上述受试者中测定到的上述每个独立的生物标志物的表达量数据和上述受试者的年龄;以及处理器,对上述受试者的上述每个独立的生物标志物的表达量数据进行前处理,并利用(4-i)作为上述经前处理的数据的上述受试者的测定数据、或者(4-ii)上述测定数据和上述受试者的年龄,从上述肺癌判定模型判定上述受试者的肺癌发病与否,其中,上述肺癌诊断用复合生物标志物群包含独立的生物标志物CEA、HE4、ApoA2、TTR、sVCAM-1和RANTES。

发明效果

根据本发明,具有如下效果:能够构成与现有的复合生物标志物群相比具有更高的肺癌诊断能力的复合生物标志物群。

并且,根据本发明,具有如下效果:能够进一步提高肺癌诊断用试剂盒及利用肺癌诊断用试剂盒的肺癌诊断方法的效率。

此外,根据本发明,具有如下效果:能够通过有效的诊断来提高肺癌患者的生存率,而且能够监测患者对治疗的反应,从而根据该结果更换治疗方式。

附图说明

为了用于本发明的实施例的说明中而所附的以下附图仅仅是本发明的实施例中的一部分而已,对本发明所属技术领域的普通技术人员(以下,称为“普通技术人员”)来说,不需要创造性的劳动,也能够以这些图为基础得到其它图。

图1是示意性地表示用于评价通过利用根据本发明的肺癌诊断用生物标志物群来对肺癌患者和正常人进行分类(classify)的逻辑回归模型性能的工具即ROC曲线(受试者工作特征曲线)的图。

图2是表示作为构成本发明的肺癌诊断用复合生物标志物群的独立的生物标志物的HE4在肺癌患者和正常人的样品中显示出的表达量和受试者的年龄所具有的相关关系的图表。

图3是表示在对肺癌患者和正常人的样品的本发明的实验中所利用的独立的生物标志物的测定数据中去除剩余的生物标志物和年龄的影响力的数据的一示例性密度图(density plot)。

图4是对训练集示意性地表示作为用于根据本发明的肺癌诊断用复合生物标志物群和包含本发明的实验中所利用的12个独立的生物标志物的总体生物标志物群的评价指标的ROC曲线的图。

图5是对验证集示意性地表示作为用于根据本发明的肺癌诊断用复合生物标志物群和包含本发明的实验中所利用的12个独立的生物标志物的总体生物标志物群的评价指标的ROC曲线的图。

图6至图10是示意性地表示用于包含上述独立的生物标志物的根据本发明的肺癌诊断用复合生物标志物群的评价指标的ROC曲线的图。

图11是概要性地表示根据本发明的、为了对受试者进行肺癌诊断而利用复合生物标志物群的信息的计算系统的结构的示意图。

具体实施方式

为了明确本发明的目的、技术方案和优点,后述的本发明的详细说明参照示例性地示出能够实施本发明的特定实施例的附图。对这些实施例进行详细说明,使得普通技术人员能够足以实施本发明。

在本说明书中,“生物样本”是指从活体提取的样本,其范畴优选覆盖包括血液、血浆、血清、淋巴液、脑脊液等组织液和从活体分泌、排出或提取到的小便、大便、泪水、唾液等物质。

此外,在本说明书中,“抗体”是指对抗原性部位进行指示(indicate)的特异蛋白质分子,包含多克隆(polyclonal)抗体、单克隆(monoclonal)抗体、重组抗体和能够与抗原决定簇结合的片段等所有抗体。其中,特别优选利用单克隆抗体。如果这种抗体为由普通技术人员利用所公知的技术来制备的抗体,则均可利用。上述抗体例如也可以通过根据普通技术人员所知晓的现有方法将作为免疫原的蛋白质注射到外部宿主来制备。

并且,在本说明书中,“正常人”也包含患有其它疾病而非肺癌的人群,是意在指非肺癌患者的用语。

此外,在本发明的详细说明和权利要求中,“包括”这一单词及该单词的变形并不是用来排除其它技术特征、附加物、结构要素或步骤。本发明的其它目的、优点和特性的一部分将会通过本说明书披露给普通技术人员,并且另一部分将会通过对本发明的实施披露给普通技术人员。以下的示例和附图作为实施例来提供,并不是用来限定本发明。

尤其,本发明包括本说明书中所记载的实施例的所有可能的组合。应理解为本发明的多种实施例虽然彼此不同,但无需相互排斥。例如,本说明书中对于一实施例所记载的特定形状、结构和特性在不脱离本发明的技术思想和范围的情况下可以以其它实施例实现。此外,应理解为,各个所公开的实施例内的个别结构要素的位置或配置在不脱离本发明的技术思想和范围的情况下可进行变更。因此,后述的详细说明并不是限定性的,如果合理地说明,本发明的保护范围则仅通过所附的权利要求来限定,且包含与该权利要求所主张的范围等同的所有范围。在附图中,相似的附图标记在多个方面表示相同或相似的功能。

如果在本说明书中以不同方式表示或在文脉中不明显矛盾,则只要在该文脉中不要求不相同,以单数表示的项目包含多数的情况。

下面,为了使普通技术人员能够容易实施本发明,提出根据本发明的实施方式的例示性的的结构、装置、方法和与这些相关联的结果。

所利用的独立的生物标志物的种类。虽然属于本发明的复合生物标志物群的独立的生物标志物包括HE4、CEA、ApoA2、RANTES、TTR和sVCAM-1,但本发明的复合生物标志物群并不限定于此,如果是肿瘤学上已知的生物标志物,则任一生物标志物也可以与上述列举的独立的生物标志物一同用于肺癌诊断。独立的生物标志物是否有助于肺癌诊断则需要另行判断,但本说明书中将公开至少包含HE4、CEA、ApoA2、RANTES、TTR和sVCAM-1的复合生物标志物群。由本发明人选择的独立的生物标志物如下所示。

HE4(Human Epididymis Protein 4,人附睾蛋白4)为由WFDC2基因编码的蛋白质,也被称作WAP四二硫化物核心域蛋白2(WAP four-disulfide core domain protein 2)。以往,HE4作为卵巢癌的肿瘤标记公知。

CEA(Carcinoembryonic antigen,癌胚抗原)为与细胞附着相关联的糖蛋白。CEA通常由胎儿阶段的胃肠道组织合成,在出生前停止该CEA的生成。因此,在健康成人的血液中仅以非常低的水平存在。但是,由于对几种类型的癌症来说,血清中的CEA水平增加,因此在临床上CEA水平可用作肿瘤标记。

ApoA2(Apolipoprotein A-II,载脂蛋白A-II)为由人类的APOA2基因编码的蛋白质。其在高密度脂蛋白质粒子中为第二丰富的蛋白质。

RANTES(regulated on activation,normal T cell expressed and secreted;Chemokine(C-C motif)ligand 5)(调节活化的正常T细胞表达和分泌因子,也叫作趋化因子配体5)为由人类的CCL5基因编码的蛋白质。

TTR(Transthyretin,转甲状腺素蛋白)为存在于血清和脑脊液中的运输蛋白,运输与作为甲状腺激素的甲状腺素(thyroxine)和视网醇相结合的视网醇-结合蛋白。肝脏向血液分泌TTR,脉络丛(choroid plexus)向脑脊液分泌TTR。

sVCAM-1(soluble vascular cell adhesion molecule-1,可溶性血管细胞黏附分子-1)为溶解有vcam-1的状态的细胞附着分子,可作为针对细胞损伤时产生的炎症反应的很重要的生物标志物来发挥作用。

除这些已选择的独立的生物标志物之外,与本发明的实验相关的独立的生物标志物如下所示。

ApoA1(载脂蛋白A-I,Apolipoprotein A-I)为由人类的APOA1基因编码的蛋白。其作为对脂质代谢发挥重要功能的蛋白而公知。

B2M(β-2微球体蛋白,Beta-2microglobulin)为MHC class I(I型主要组织相容性复合体)分子的组成部分(component)。对人类来说,B2M蛋白由B2M基因编码。

CA125(CA-125;cancer antigen 125;carcinoma antigen 125;或carbohydrateantigen 125)(癌抗原125,也叫糖抗原125)也作为mucin 16或MUC16而公知,其为由人MUC16基因编码的蛋白。CA125由于在患有特定类型癌症的患者血液内的浓度变高,因此CA125可用作肿瘤标记。

CRP(C-reactive protein,C-反应蛋白)为从血浆中确认到的环形的五聚体蛋白。公知的是,由于CRP与炎症反应而其浓度会增加。

LRG1(Leucine-rich alpha-2-glycoprotein 1,人富亮氨酸α2糖蛋白1)为由人LRG1基因编码的蛋白。也公知的是,在得了急性阑尾炎时,LRG1的浓度增加。

Cyfra 21-1{cytokeratin 19fragment antigen 21-1;Keratin,type Icytoskeletal 19;cytokeratin-19(CK-19);或keratin-19(K19)}(细胞角蛋白19片段抗原21-1,也叫细胞角蛋白21-1)为由人KRT19基因编码的40kDa蛋白。Cyfra 21-1为I型角质蛋白(type I keratin),作为用于检测由乳房癌患者的淋巴结、末梢血液、骨髓分泌的肿瘤细胞的生物标志物而公知。

为了分析独立的生物标志物而利用的抗体或试剂盒。为了分析HE4、RANTES、sVCAM-1、LRG1、CEA、Cyfra21-1、ApoA2、ApoA1、TTR、B2M、CA125、CA19-9、CRP等13种蛋白,本发明人从各个制造公司购买了抗体或试剂盒。抗体、试剂盒、标准物质(标准蛋白)等的购买源信息如以下表1至表2所示。

[表1]

生物标志物标准物质制造公司对应抗体制造公司1对应抗体制造公司2HE4XEMAXEMAXEMARANTESPeproTechR&D SystemsR&D SystemssVCAM-1R&D SystemsR&D SystemsR&D SystemsLRG1R&D SystemsR&D SystemsR&D Systems

[表2]

至于标准蛋白,HE4标准蛋白从XEMA公司购买,RANTES标准蛋白从PeproTech公司购买,sVCAM-1和LRG-1标准蛋白从R&D Systems公司购买,而至于主试剂和校准物质(calibrator),CEA、Cyfra21-1、B2M、CA125和CA19-9蛋白从Roche公司购买,ApoA1和ApoA2蛋白从Sekisui公司购买,TTR和CRP蛋白从Siemens公司购买。

获取肺癌患者的血清样本。从峨山医院和启明大学童山医疗院的肺癌一期163名、肺癌二期42名、肺癌三期62名和肺癌四期89名即总计355名(来自峨山医院的患者为242名、来自启明大学童山医疗院的患者113名)肺癌患者中获取末梢血液。根据这些患者病历详细分类后,腺癌为230名,鳞状细胞癌为109名,大细胞癌为4名,神经内分泌癌为2名,其它10名。按性别区分后,男性为139名,女性为216名;按年龄区分后,平均年龄为63.58岁,中间年龄为66岁,范围为最小25岁至最大83岁。

在此,上述肺癌患者利用众所周知的方法来确诊,在这种方法中包含有胸部单纯X光照片(X-ray)、胸部电子计算机断层扫描(CT)、超声波检查、核磁共振成像(MRI)、正电子断层扫描(PET)、肺功能检查、肺灌注扫描、肺组织检查{CT引导下经皮肺穿刺活检(增殖细胞核抗原,PCNA)}、癌性胸腔积水和胸膜组织检查以及作为分子生物检查的关于EGFR(表皮生长因子受体)突变(EGFR mutations)、基因拷贝数(gene copy number)、表达水平(levelof expression)、K-ras(Kirsten鼠肉瘤病毒癌基因)突变(K-ras mutation)和EML4(棘皮动物微管相关类蛋白4)-ALK(间变性淋巴瘤激酶)融合基因(EML4-ALK fusion oncogene)的检查,但并不限定于此,这对普通技术人员来说是众所周知的。

获取对照组的血清。从首尔大学医院的家庭医学科获取590名非肺癌患者人群即正常人受试者的末梢血液。根据他们的性别分类后,男性为274名,女性为343名,根据年龄分类后,平均年龄为56.87岁,中间年龄为56岁,范围为最小38岁至最大79岁。

均利用Vacutainer SST II管(碧迪公司)等众所周知的工具对肺癌患者和对照组进行采血之后,经离心分离而分离出血清。

测定及构建结果数据。通过利用以这种方式获取的血清样本测定独立的生物标志物蛋白质的表达量,来构建其结果数据,其中所利用的定量方法如下所示。

HE4及LRG-1蛋白质定量

首先,利用ELISA(Enzyme-Linked ImmunoSorbent Assay;酶联免疫吸附分析)方法测定HE4及LRG-1蛋白质。如普通技术人员所公知,ELISA方法为如下的方法:通过抗体将霉标记到抗原上来测定霉活性并定量测定抗原-抗体反应强度和反应量。其中,在对生物素进行标记之后利用检测抗体(detection antibody)。ELISA实施方法的具体步骤如下所示。

检测抗体的生物素标记。为了使HE4及LRG-1的ELISA定量中所利用的检测抗体(detection antibody)生物素化(biotinylation),利用EZ-Link Sulfo-NHS-LC-生物素(sulfosuccinimidyl-6-[biotin-amido]hexanoate;硫代琥珀酰亚胺基-6-[生物素-氨基]乙酸,ThermoFisher Scientific(赛默飞世尔科技),沃尔瑟姆,马来西亚)试剂,并根据制造商所推荐的方法来进行。对此进行简单说明,将400μg抗-人-HE4抗体(anti-humanHE4antibody;XEMA有限公司,莫斯科,俄罗斯)或抗-人-LRG1抗体(anti-human LRG-1antibody;R&D systems公司,明尼阿波利斯,明尼苏达州)置于PBS(磷酸盐缓冲)溶液400μl中,并加入与抗体相比摩尔(mole)比高20倍的10mM磺基-NHS-LC-生物素(Sulfo-NHS-LC-Biotin)之后,使其在常温下反应30分钟。当生物素标记完成时,分别用PBS溶液1L透析(dialysis)三次之后在-80℃下保管直至分注利用为止。

HE4和LRG-1ELISA。利用ELISA方法对HE4和LRG-1进行定量,简单说明,则在96-孔微板(Nalgene Nunc公司,罗切斯特纽约)中以1μg/ml浓度加入100μl关于人HE4的捕获抗体(capture antibody;XEMA有限公司,莫斯科,俄罗斯)之后,在4℃下涂布一晚。用清洗溶液(含有0.05%的吐温20(tween 20)的PBS)进行3次清洗后,通过将含有5%脱脂乳(skimmilk)的PBS溶液加入到孔(well)中并在室温下搅拌两小时来截止非特异性结合。利用清洗溶液清洗三次之后,在各孔中分别加入100μl血清或标准校准物质(standardcalibrator),并在室温下使其反应一小时之后清洗三次。以1μg/ml浓度对上述所准备的已标记生物素的检测抗体进行处理,并在室温下使其再次反应一小时。在清洗三次之后,添加0.5μg/ml链霉亲和素-辣根过氧化物酶(streptavidin-horseradish-peroxidase)(Sigma-Aldrich(西格玛奥德里奇),圣路易斯,密苏里州)并在室温下使其反应30分钟后清洗5次。为了引导发色反应,分别添加100μl的TMB(四甲基联苯胺;KPL公司,盖瑟斯堡,马里兰州州),在15分钟之后用2N磺酸50μl停止反应,并利用酶标仪(Emax;Molecular DevicesLLC.,森尼维耳,加利福尼亚州)在450nm下测定吸光度。其结果,利用SoftMax Pro软件(分子器件,Molecular Device)且通过五个母数(5-parametric)曲线拟合进行了分析。从XEMA公司购买了校准用HE4标准蛋白,从R&D公司购买了LRG-1蛋白。

RANTES、sVCAM-1蛋白定量

接着,通过利用xMAP技术平台(Luminex公司,奥斯丁,德克萨斯州)的多重免疫分析法(multiplex immunoassay)测定RANTES和sVCAM-1在肺癌患者和正常人的血清内的浓度。与ELISA蛋白质印迹法(western blotting)、PCR(聚合酶链反应法,polymerase chainreaction)等现有分析法相比,多重免疫分析法的时间和费用得到缩减,并且该多重免疫分析法是普通技术人员所公知的分析法。在此,捕获抗体则通过碳二亚胺(carbodiimide)法使其结合到MagPlex微球体(microspheres)中来利用,并在全过程中使微球体暴露到光线中的现象最小化。

抗体-微球体结合。上述定量过程根据制造商所推荐的规程来执行,首先对MagPlex(Luminex公司)微球体悬浮液进行旋涡混合(Vortex;vortexing)之后,在超声波容器(sonification bath;Sonicor Instrument Corporation,美国)中悬浮20秒。在将1×106个微球体转移到微管(microtube)中并利用磁铁进行分类而去除溶液之后,用100μl蒸馏水进行清洗后再悬浮(re-suspension)在0.1M磷酸钠缓冲溶液(sodium>6个/500μl的PBS-TBN保管。

sVCAM-1、RANTES多重免疫检查。现利用上述抗体结合微球体且通过多重检查方法同时定量sVCAM蛋白及RANTES蛋白内的血清内浓度。具体而言,在96-孔微板的各孔中混合RANTES标准蛋白质((R&D Systems公司)和sVCAM-1标准蛋白质(PeproTech公司,罗基希尔,新泽西州)或20μl血清和结合有关于两个生物标志物蛋白即RANTES及sVCAM-1的捕获抗体的微球体混合液20μl之后,在室温下使其反应一个小时。之后,加入20μl标记有生物素的检测抗体(biotinylated detection antibody)使其反应一个小时,然后加入20μl链霉亲和素-藻红蛋白使其反应30分钟。通过PBST(0.05%Tween20,PBS)溶液且利用微板清洗剂{microplate washer(HydroFlexTM;TECAN,瑞士)}来清洗两次反应后的板,然后使微球体再悬浮于100μl相同的缓冲溶液中,并利用LuminexTM200测定荧光强度。利用Upstate公司(Upstate,USA)的Beadview软件(Beadview>

CEA、Cyfra21-1、CA125、CA19-9、ApoA1、ApoA2、B2M、TTR及CRP蛋白质定量

在Cobas e601(霍夫曼-罗氏公司,瑞士)设备中利用电化学发光免疫测定法且按照制造商的说明书测定了CEA、Cyfra21-1、CA125及CA19-9蛋白质,在7080型全自动生化分析仪(日立医疗公司,日本)设备中利用免疫比浊法且按照制造商的说明书测定了ApoA1、ApoA2和B2M蛋白质,在BN2System(西门子股份公司,德国)设备中利用免疫比浊法且按照制造商的说明书测定了TTR和CRP蛋白质。

关于生物标志物有效性的统计证明

通过上述测定获取的蛋白质定量数值即实验值为经前处理后用于下述所详细说明的统计分析中的测定数据。在此,所谓前处理可以是采用以10为底数的对数(log10)变换的处理。在本实施例中,由于具有实验值的分布向右收敛的倾向,因此为了缓解这种倾向,对所有独立的生物标志物的实验值采取对数变换。以下,只要在本说明书中所说明的一实施例中未另外提及就可以利用以该方式变换的测定数据。

利用生物信息学(bioinformatics)和作为统计分析方法的R统计包(R核心开发团队(2007).R:统计计算语言和环境.R统计计算基础,维也纳,澳大利亚.ISBN 3-900051-07-0,URL http://www.R-project.org.)来分析构建出的测定数据。通过下述分析,由输入后的数据生成肺癌判定模型。

肺癌判定模型的一示例-二元逻辑回归分析。一般线性回归分析是应变数为连续型的情况,与此相反,逻辑回归分析为用于应变数为诸如失败/成功、正品/次品、肺癌/非肺癌等两个的情况{即,二元(binary))}的回归分析方法。逻辑回归分析模型如下所示。

Pi=P(yi=1)具有0与1之间的值,yi的值为0或1,在本说明书中被设定为0表示非肺癌,1表示肺癌。此外,各个xk表示引入肺癌诊断中的独立的生物标志物的实验值(log值)。在R统计包中例如可利用如下的指令来执行逻辑回归,其结果,模型对象作为回归模型来导出。

m<-glm(b~x1+x2+x3+x4+x5+x6,family=binomial)

由于可利用该模型对象m来执行个别受试者的肺癌判定,因此可将该回归模型称作肺癌判定模型。在此,b为具有两个水平的因素(在本说明书中,真=肺癌,假=正常),x1、x2、x3、x4、x5、x6为预测变量。例如,x1、x2、x3、x4、x5、x6可以是分别与CEA、HE4、ApoA2、TTR、sVCAM-1和RANTES的表达量的数据对应的测定数据。此时,能够由从受试者测定到的测定数据预测该个别受试者是否为肺癌患者,例如,运行该预测的R统计包的指令可如下所示。

dfrm<-data.frame(x1=value,x2=value,x3=value,x4=value,x5=value,x6=value)

predict(m,type=”response”,newdata=dfrm)

本发明人通过对下述所说明的多种复合生物标志物群执行上面所提及的逻辑回归来获得逻辑回归模型。具体而言,为了验证逻辑回归模型的可行性,本发明人利用了10折交叉验证法(10fold cross validation)。在10折交叉验证法中,首先将数据随机(random)分割为10个段(segment)。留一个段而用九个段进行训练,即在本实施例中生成逻辑回归模型之后,利用剩余一个段来执行前述的预测即进行验证。对所有段反复执行上述过程。可通过整合该预测结果,确认该预测性能,ROC曲线为用于该预测的一种工具。

肺癌判定模型的性能尺度-ROC曲线。由于前述的肺癌判定模型发挥一种分类器(classifier)的功能,因此可通过表示分类器性能的ROC曲线(接受者操作特征曲线,Receiver Operating Characteristic Curve)来确认其性能。

图1是示意性地表示用于评价逻辑回归模型性能的工具即ROC曲线的图。参照图1,首先,表示在ROC曲线坐标图的横轴中的数值为1–特异度(specificity)=假阳性率(falsepositive rate),特异度通过特异度(specificity)=真阴性(true negative)/(假阳性(false positive)+真阴性(true negative))来定义的值。即,由于特异度表示将“错(阴性)”判断为错的比率,因此可知在坐标图中越向左侧倾斜则将“对(阳性)”判断为错的误判比率越缩小。此外,表示在ROC曲线坐标图的纵轴中的数值为敏感度(sensitivity)=真阳性率(true positive rate),敏感度为通过敏感度(sensitivity)=真阳性率(truepositive rate)/(真阳性率(true positive rate)+假阴性(false negative))来定义的值。即,由于敏感度表示将“对”判断为“对”的比率,因此可知在坐标图中越向上倾斜则将“错”误判为“对”的比率越缩小。因此,分类器越准确地判断则坐标图的曲线下面积(AUC;area under curve)越增加。当分类器不具有任何准确判断的分类性能时,AUC为5。一般,根据AUC数值可分类成无信息(AUC=0.5)的检查、不太精确(0.5<AUC≤0.7)的检查、非常精确(0.9<AUC<1)的检查和完美(AUC=1)的检查。

肺癌判定模型性能的验证(ROC-AUC)。可通过将表示本发明的肺癌判定模型完全不具有分类性能的AUC=0.5设为零假设,并将逻辑回归模型具有分类性能的情况设为对立假设,执行假设验证。在将出现错误的概率称作假设概率(p-value)(显著概率)的情况下,当假设概率低于规定概率时,舍弃零假设采纳对立假设,将该规定概率称作显著水平,统计学上一般将0.05值作为显著水平来采用。肺癌判定模型可以以考虑如下的ROC的AUC的方式验证其性能。接着,对生成本发明的肺癌判定模型时所要考虑的事项进行说明。

考虑生物标志物HE4与受试者的年龄之间的相关关系(若没有额外提及,所有HE4为校准的HE4)。图2是表示受试者的HE4表达量与受试者的年龄之间的相关关系的图表。参照图2,可知在HE4表达量与受试者的年龄之间存在正相关关系。在该示意性图表中,相关系数(皮尔森系数)的值为0.490,假设概率<2.2e-16。在该图中,表示了生物标志物HE4的表达量与年龄之间的相关关系。因此,为了客观地评价生物标志物HE4的有效性,可导出从生物标志物HE4的表达量中去除年龄影响力的值即“经校准的”表达量。至于HE4,通过回归分析,由(HE4)=β01×(age)+∈这一关系式导出β0和β1的推定值。在将以这种方式推定的值分别定义为时,可用来定义关于HE4的残差值。

属于本发明的复合生物标志物群的独立的生物标志物的选择过程

首先,本发明人从人体内存在的数万个以上的蛋白质中先选择120个蛋白质标记(protein markers)的候选组,并通过考察国内外学术论文及文献和二维电泳(2D Gel)、SELDI-TOF MS分析法等,考虑临床意义、分析便利性、算法准确度、费用和临床条件等各种情况,来从上述120个蛋白质标记中挑选50个左右的标记,在第二次将肺癌患者600余名、正常受试者900余名作为对象且通过结果数值的统计分析来验证有效性,从而选择13个被预测为适于包含在本发明的复合生物标志物群中的最终候选组。更具体地,可以引入通过在诸如Breast Cancer Research(乳房癌研究)2009,11,R22的论文或诸如Journal ofThoracic,Cardiac&Vascular Surgery 2012:143;421-7的论文中所记载的过程而从120个蛋白质标记中筛选出50多个标记后从中选择13个标记的情况,但可以不限于此。

本发明人利用前述的实验数据(用于训练的实验数据)从选择为最终候选组的总计13个独立的生物标志物和两个人口统计学变量中成功地找出了优选包含在本发明的统计模型中的最优异的部分集合。在本发明人所进行的该研究中,从独立的生物标志物和两个人口统计学变量中慎重地选择了六个独立的生物标志物和年龄(age)。具体地,利用训练数据(training data)的515个正常样本和280个癌样本而选择复合生物标志物群。训练数据由启明大学童山医疗院的113个非小细胞肺癌样本、峨山医院的167个非小细胞肺癌样本、首尔大学医院家庭医学科的515个样本构成。为了验证选择的复合生物标志物群,使用验证数据(validation data)。验证数据由峨山医院的75名的非小细胞肺癌样本、首尔大学医院家庭医学科的75名的正常样本构成。包含有HE4、CEA、ApoA2、TTR、sVCAM-1和RANTES,但去除了ApoA1、B2M、CA125、CA19-9、CRP、Cyfra21-1和LRG1。关于此的说明将在后面叙述。

为了方便说明,将构成根据本发明的复合生物标志物群的该组合称作“BI”组合,将包含从前述的13个独立的生物标志物及两个人口统计学变量中去除CA19-9和性别的剩余12个独立的生物标志物和年龄的组合称作“全组合”。

选择这种“B1组合”的理由如下所示。首先,卡方检验(chi square test)和学生t检验(Student`s t-test)用于评价上述13个独立的生物标志物及两个人口统计学变量的差异性。

独立的生物标志物CA19-9及性别的去除。在该步骤中去除独立的生物标志物CA19-9及性别。在显著水平0.05下,无需注意性别与是否为肺癌患者之间的关联性(p-value:0.314)。此外,无需注意对照组的平均与实验组的平均之间的差异(p-value:0.2829)。作为参考,在下述表3中示出了将性别和是否为肺癌患者彼此独立的这一命题设为零假设的卡方检验的结果值,在表4中示出了将使对照组平均值与实验组平均值之间的差异的真值为0的命题设为零假设的学生t验证的结果值。

[表3]

[表4]

tdfp-valueHE4-14.506346.247<2.2e-16Cyfra21-1-10.595397.976<2.2e-16CEA-11.531374.846<2.2e-16ApoA218.050358.791<2.2e-16RANTES17.981404.302<2.2e-16TTR16.04,373.111<2.2e-16ApoA111.649425.734<2.2e-16LRG1-11.418377.333<2.2e-16CRP-11.381461.46<2.2e-16B2M-10.160388.398<2.2e-16CA125-7.983353.0872.022e-14sVCAM-12.348494.9990.01928CA19-9-1.075401.2490.2829年龄-10.206513.367<2.2e-16

如果从属于上述全组合的所有独立的生物标志物的每一个(以下,称作“A”)中去除能够由其它独立的生物标志物来说明的效果,即如果在利用线性回归时考虑由上述其它独立的生物标志物的实验数据的线性结合来预测的上述生物标志物A的残差值,则能确认是否在上述标志物A中存在将肺癌患者实验组和对照组相区别的有用效果。

更具体说明,在将构成全组合的独立的生物标志物称作Bi时,通过线性回归分析导出上述生物标志物A的值为如下。

在此,表示从上述生物标志物A的值中去除由独立的生物标志物Bi以及年龄来说明上述生物标志物A的部分的残差值为如下。

类似地,表示从年龄(age)减去由剩余的独立的生物标志物说明的部分的残差值如下。

本发明人为了由该残差值来验证独立的生物标志物的显著性,实施关于上述残差值的学生t验证,其中的零假设表示上述残差值在对照组中的平均值(“对照组平均值”)和在实验组中的平均值(“实验组平均值”)之间不存在差异,其结果如表5所示。

[表5]

参照表5,由于对属于BI组合的独立的生物标志物即HE4、CEA、ApoA2、TTR、sVCAM-1、RANTES来说,均得到小于显著水平0.05的假设概率,因此能确认上述残差值与对照组平均值和实验组平均值具有差异的该独立的生物标志物的显著性,但与此相对地,全组合中的不属于BI组合的独立的生物标志物即ApoA1、B2M、CA125、CA19-9、CR、Cyfra21-1、LRG1则在显著水平0.05下均无意义。总之,除属于上述BI组合的独立的生物标志物之外,已去除的独立的生物标志物的作为分类器对肺癌患者和对照组的性能没有意义(即,不好)。

从图3可通过视觉确认表5的结果。图3为表示独立的生物标志物的上述(上方的)残差值的密度图(density plot)。两个密度图表中,红色为关于肺癌患者组的图表,黑色为对照组(正常人)的图表。两个垂直线中,红色表示肺癌患者组的平均,灰色表示对照组的平均。可见,属于本发明的复合生物标志物群的独立的生物标志物呈现的、肺癌患者组的平均和对照组的平均之间的相差,即至于平均差较大。图3中可通过视觉获知,与其它独立的生物标志物相比,属于本发明的符合生物标志物群的独立的生物标志物为更有利于肺癌判定的生物标志物。

即,在由本发明人进行的实验及分析中,判定为利用上述BI组合比利用上述全组合更有利。训练组的ROC曲线如图4所示,并够确认如下的效果:如下述表6所示,在利用全组合(AUC=0.9868239)时和利用BI组合(AUC=0.9864008)时,该ROC曲线的AUC相似,不管BI组合从全组合的12个独立的生物标志物中足足去除六个独立的生物标志物,但表示BI组合的分类性能的AUC与全组合几乎相同,因此更经济地得到相同的效果。

[表6]

不仅如此,当用验证组执行预测时,被判断为如表7所示,BI组合(AUC=0.9884444)的性能反而比全组合(AUC=0.9818667)的性能更优异,因此整体上BI组合比全组合有利。关于上述验证组的ROC曲线如图5所示。

[表7]

AUCp-value全标记0.98186671.143172e-24BI标记0.98844442.709566e-25

利用以上选择的复合生物标志物群,整合训练数据和验证数据,并采用十折交叉验证法考察了分类器性能。

如此,利用通过由本发明人提出的方法论而导出的一示意性模型即示意性复合生物标志物群的分类器的性能概要地示出到以下的表9中。该示意性复合生物标志物群均考虑了HE4、CEA、ApoA2、RANTES、TTR、sVCAM-1和受试者的年龄。

[表8]

由表8可知,用于分类器的算法为GLM(广义线性模型,Generalized LinearModel),尤其为逻辑回归模型,AUC为0.988,p-value为0.000,敏感度为总体94.65%,对一期患者也可以以91.98的高敏感度判定是否为肺癌。在此,特异度为93.90,此时临界值(threshold;cutoff:阈值)为0.3700928。在所有肺癌发展阶段(stage)中,这种临界值点的敏感度为90%以上,并被选择为特异度充分高的点。对这种选择理由进行具体说明,最佳精确度(best accuracy)受到标本数的影响,在本说明书的实验中,由于正常人标本数比肺癌标本数多,因此特异度相对高的点为呈现最佳精确度的点。总之,通过利用p-value 0.000舍弃零假设(AUC=0.5),从而呈现出统计学上的显著性能。

利用十折交叉验证法确认的上述回归模型的回归系数范围。上述一示意性逻辑回归模型为由整体训练组导出的模型,虽然该回归模型的回归系数设定为一个,但如果利用对总体实验组的十分之九重复进行回归模型导出的十折交叉验证法,则能够求出关于独立的生物标志物的回归系数所具有的范围,其结果如以下表9所示。

[表9]

最小值最大值HE4(即,校准的HE4)2.7795373.30755CEA1.1821471.448989ApoA2-1.56861-1.35275RANTES-2.69601-2.45476TTR-1.76552-1.48475Svcam.1-1.95726-1.72294年龄1.1300431.394296(intercept,截距)-0.83606-1.03448

在此,利用关于独立的生物标志物的实验数据值单位的逆(inverse)来表示关于独立的生物标志物的回归系数单位。这是因为逻辑回归模型的结果值即应变数应为无单位的值。由于所利用的HE4的实验数据单位为log(pM),因此关于HE4的回归系数单位为{log(pM)}-1。此外,由于ApoA2和TTR的实验数据单位为log(mg/dL),因此关于各个ApoA2和TTR的回归系数单位为{log(mg/dL)}-1,并且由于sVCAM-1、CEA、RANTES的实验数据单位为log(ng/mL),因此关于各个sVCAM-1、CEA、RANTES的回归系数单位为{log(ng/mL)}-1。当然该回归系数范围为示例,根据本发明的逻辑回归模型并不限定于此。

由小细胞肺癌实验组进行的预测性能评价。仅利用正常人和非小细胞肺癌患者来构建上述分类器,本发明人为了确认该分类器是否对小细胞肺癌也显示出分类性能,利用上述分类器对小细胞肺癌实验组执行用于判定是否为肺癌患者的预测。当然,该实验组应判定为肺癌患者。在下述表10中提出了预测结果。

[表10]

参照表10,能确认如下的非常振奋人心的(惊人的)结果:即,以100%敏感度将41名受试者均分类成癌症。

本发明的复合生物标志物群与其它复合标志物群之间的比较

现通过对应用单向生物标志物的其它复合生物标志物群也求出前述的逻辑回归模型来导出AUC,其结果如下述表11所示。

[表11]

在表11中的各个行中示出了用于复合生物标志物群的独立的生物标志物,在下(bottom)行中示出了与根据本发明的复合生物标志物群对应的数据,在此,AUC表示根据利用该独立的生物标志物来导出的模型的AUC值,AUCrank表示AUC较高的顺序。与此同时,在图6至图10中更具体地示出了如表11所示的关于各个复合生物标志物群的ROC曲线的一实施例。

在图6中,对将HE4和CEA作为必须的独立的生物标志物包含的复合生物标志物群分别增加一个独立的生物标志物而获得ROC曲线。在此,comb3相当于将HE4和CEA作为独立的生物标志物包含的复合生物标志物群,comb4相当于由HE4、CEA和RANTES构成的复合复合生物标志物群,comb5相当于由HE4、CEA、RANTES和TTR构成的复合生物标志物群,comb6相当于由HE4、CEA、RANTES、TTR和sVCAM-1构成的复合生物标志物群,comb7相当于由HE4、CEA、RANTES、TTR、sVCAM-1和ApoA2构成的复合生物标志物群。对图6的所有复合标志物群一同考虑了年龄。在图6的所有复合生物标志物群中comb7即由HE4、CEA、RANTES、TTR、sVCAM-1和ApoA2构成的本发明的复合生物标志物群呈现出最高的准确性。

接着,图7中示出了由重要的两种生物标志物构成的复合生物标志物群的ROC曲线。在此,comb1相当于由HE4和CEA构成的复合生物标志物群,comb2相当于由CEA和Cyfra21-1构成的复合生物标志物群,comb3相当于由HE4和RANTES构成的复合生物标志物群。对该所有复合复合标志物群一同考虑了年龄。

此外,图8中示出了将HE4和CEA作为必须的独立的生物标志物包含,并进一步包含一种独立的生物标志物的复合生物标志物群的ROC曲线。在此,comb1相当于由HE4、CEA和ApoA2构成的复合生物标志物群,comb2相当于由HE4、CEA和TTR构成的复合生物标志物群,comb3相当于由HE4、CEA和sVCAM-1构成的复合生物标志物群,comb4相当于由HE4、CEA和RANTES构成的复合生物标志物群。对该所有生物标志物群一同考虑了年龄。如图8和表11所示,该所有复合生物标志物群显示出比图7所示的组合更高的准确性,尤其均包含HE4、CEA和RANTES的组合comb4显示出最高的准确性。

并且,图9中示出了将HE4和CEA作为必须的独立的生物标志物包含,并进一步包含两种独立的生物标志物的复合生物标志物群的ROC曲线。在此,comb1相当于由HE4、CEA、ApoA2和TTR构成的复合生物标志物群,comb2相当于由HE4、CEA、ApoA2和sVCAM-1构成的复合生物标志物群,comb3相当于由HE4、CEA、TTR和sVCAM-1构成的复合生物标志物群,comb4相当于由HE4、CEA、ApoA2和RANTES构成的复合生物标志物群,comb5相当于由HE4、CEA、TTR和RANTES构成的复合生物标志物群,comb6表示由HE4、CEA、sVCAM-1和RANTES构成的复合生物标志物群。对该所有生物标志物群一同考虑了年龄。如图9和表11所示,该所有复合生物标志物群显示出比图8所示的组合更高的准确性。

最后,图10中示出了将HE4和CEA作为必须的独立的生物标志物包含,并进一步包含三种独立的生物标志物的复合生物标志物群的ROC曲线。在此,comb1相当于由HE4、CEA、ApoA2、TTR和sVCAM-1构成的复合生物标志物群,comb2相当于由HE4、CEA、ApoA2、TTR和RANTES构成的复合生物标志物群,comb3相当于由HE4、CEA、ApoA2、sVCAM-1和RANTES构成的复合生物标志物群,comb4相当于由HE4、CEA、TTR、sVCAM-1和RANTES构成的复合生物标志物群。对该所有生物标志物群一同考虑了年龄。如图10和表11所示,与大致前面所提及的图8所示的复合生物标志物群相比,该所有复合生物标志物群显示出最优异的性能。

根据本发明的前述的实验结果,可知由HE4、CEA、RANTES、TTR、sVCAM-1和ApoA2构成的本发明的复合生物标志物群为对肺癌发病与否判定显示出最优异的性能的复合生物标志物这一点,并且可知其为能够获得达到0.998的AUC的高度准确的生物标志物这一点。总之,在利用根据本发明的复合生物标志物群的情况下,能够非常准确地判定肺癌。

由此,本发明涉及一种用于对受试者进行肺癌诊断的复合生物标志物群,提供一种包含独立的生物标志物CEA、HE4、ApoA2、TTR、sVCAM-1(可溶性血管细胞黏附分子-1,soluble vascular cell adhesion molecule-1)和RANTES的复合生物标志物群。

本发明的复合生物标志物群包含六个独立的生物标志物,并不限定于此,根据表11所示,可利用包含CEA、HE4和RANTES且进一步包含ApoA2、TTR和sVCAM-1中的至少一个的复合生物标志物群,来扩大对肺癌判定有效的复合生物标志物群的范围。作为其根据,如表11所示,可列举如下事实:在由四个独立的生物标志物构成的组合中包含CEA、HE4和RANTES且进一步包含ApoA2、TTR和sVCAM-1中的至少一个的组合的AUCrank为5、6、7,从而比由四个独立的生物标志物构成的其它组合的AUCrank9、11、12优异。不仅如此,也可以观察到在由五个独立的生物标志物构成的组合中包含CEA、HE4和RANTES且进一步包含ApoA2、TTR和sVCAM-1中的两个的组合也比仍由五个独立的生物标志物群构成的其它组合优异。如此,根据本发明的目的,为了对受试者进行肺癌诊断而可利用包含CEA、HE4和RANTES且进一步包含ApoA2、TTR和sVCAM-1中的至少一个的复合生物标志物群,接触本说明书的普通技术人员应能容易理解这一点。

此外,本发明涉及一种为了对受试者进行肺癌诊断而利用复合生物标志物群的肺癌诊断用试剂盒,包括与独立的生物标志物CEA、HE4、ApoA2、TTR、sVCAM-1和RANTES进行特异性结合的抗体的肺癌诊断用试剂盒。这种肺癌诊断用试剂盒不仅用于肺癌发病与否的判定,而且还可以以肺癌监测(monitoring)或肺癌筛查(screening)的目的使用。

如前述,包含在上述肺癌诊断用试剂盒中的抗体可包括多克隆抗体、单克隆抗体、和能够与抗原决定簇结合的片段等。在此,多克隆抗体可通过如下的现有方法来生产:即,将上述独立的生物标志物中的任一种注射到动物并对该动物进行采血来获取包含抗体的血清。

这种多克隆抗体可通过本发明所属技术领域所知晓的某种方法来提炼,也可以由山羊、兔、羊、猴、马、猪、牛、狗等任一动物的终宿主制备。

此外,单克隆抗体也可以通过提供由连续细胞株的培养带来的抗体分子的生成的某种技术来制备。作为这种技术,包括杂交瘤技术、人B-细胞杂交瘤技术和EBV-杂交瘤技术(Kohler G et al.,Nature 256:495-497,1975;Kozbor D et al.,J Immunol Methods81:31-42,1985;Cote RJ et al.,Proc Natl Acad Sci 80:2026-2030,1983;以及Cole SPet al.,Mol Cell Biol 62:109-120,1984),但并不限定于此。

此外,可制备含有关于上述独立的生物标志物中的任一个的特异性结合部位的抗体片段。例如,F(ab')2片段可通过使抗体分子分解为胃蛋白酶来制备,Fab片段可通过使F(ab')2片段的二硫桥建还原来制备,但并不限定于此。作为替代方案,也可以通过制作Fab表达库来迅速且简便地识别具有所需的特异性的单克隆Fab片段(Huse WD et al.,Science 254:1275-1281,1989)。

上述抗体可与固体基质(solid substrate)结合,以容易进行清洗或复合体的分离等的之后步骤。固体基质具有例如合成树脂、硝化纤维、玻璃基板、金属基板、玻璃纤维、顺磁性磁珠(paramagnetic bead)、微球体和微磁珠等。此外,上述合成树脂中具有聚酯、聚氯乙烯、聚苯乙烯、聚丙烯、聚偏氟乙稀(PVDF)和尼龙等。在本发明的具体实施例中,为了使与蛋白质进行特异性结合的抗体与固体基质结合,将微球体悬浮之后,转移到微管中并利用离心分离去除上清液之后使其再悬浮,并依次加入50mg/ml的N-羟基-硫代琥珀酰亚胺(N-hydroxy-sulfosuccinimide)和1-乙基-3-(3-二甲基氨丙基)-碳二亚胺盐酸盐(1-ethyl-3-(3-dimethylaminopropyl)-carbodiimide hydrochloride)之后,利用离心分离去除上清液,然后清洗并保管。此外,在使从受试者获取的样本和能够与结合到固体基质的本发明的独立的生物标志物中的任一个蛋白质进行特异性结合的抗体接触的情况下,在样本与抗体接触之前,可将样本稀释成合适的程度。

本发明的试剂盒进一步可包括与上述生物标志物进行特异性结合的检测用抗体。上述检测用抗体可以是发色酶、荧光物质、放射性同位素或标记为胶体等检测剂的接合体(conjugate),优选为可与上述生物标志物进行特异性结合的一级抗体。例如,上述发色酶可以是过氧化物酶(peroxidase)、碱性磷酸酶(alkaline phosphatase)或酸性磷酸酶(acid phosphatase){例如,辣根过氧化物酶(horseradish peroxidase)},而在采用荧光物质的情况下,可使用荧光素羧酸(FCA)、异硫氰酸荧光素(FITC)、荧光素硫脲(FTH)、7-乙酰氧基香豆素-3-基、荧光素-5-基、荧光素-6-基、2',7'-二氯二氢荧光素-5-基、2',7'-二氯二氢荧光素-6-基、二氢四甲基罗丹明-4-基、四甲基罗丹明-5-基、四甲基罗丹明-6-基、4,4-二氟-5,7-二甲基-4-硼-3a,4a-二氮杂-s-引达省-3-乙基或4,4-二氟-5,7-二苯基-4-硼-3a,4a-二氮杂-s-引达省-3-乙基、Cy3、Cy5、聚L-赖氨酸-异硫氰酸荧光素(polyL-lysine-fluorescein isothiocyanate,FITC)、罗丹明-B-异硫氰酸盐(rhodamine-B-isothiocyanate,RITC)、罗丹明(rhodamine)、PE(藻红蛋白,Phycoerythrin)等。

此外,本发明的试剂盒进一步可包括:(1)与上述生物标志物进行特异性结合的检测用抗体;以及(2)能够与上述检测用抗体进行特异性结合的配位体。在上述配位体中具有蛋白质A或与检测用抗体进行特异性结合的二级抗体等。此外,上述配位体可以是发色酶、荧光物质、放射性同位素或用胶体等检测剂标记的接合体(conjugate)。优选上述检测用抗体为了上述配位体而利用经生物素化(biotinylation)或地高辛(digoxigenin)处理的一级抗体,但上述检测用抗体的处理方法并不限定于此。此外,为了与上述检测用抗体结合,作为上述配位体,优选使用链霉亲和素、亲和素等,但并不限定于此。在本发明的具体实施例中,将用上述检测剂附着荧光物质的链霉亲和素(streptavidin)作为配位体使用,并为了上述配位体而利用经生物素化(biotinylation)的检测用抗体。

本发明的肺癌诊断用试剂盒通过在上述抗体和生物标志物复合体中加入检测用抗体之后探索检测用抗体量,从而能够诊断、检测或筛选肺癌。在本发明的优选实施例中,将检测用抗体和清洗后的抗体-生物标志物复合体进行恒温配置之后清洗并测定检测用抗体,从而能够测定上述生物标志物量。检测用抗体的量的测定或存在检测可通过荧光、发光、化学发光(chemiluminescence)、吸光度、反射或透射来实现。

此外,优选作为探索上述检测用抗体或配位体的量的方法利用高通量筛选(highthroughput screening:HTS),在此,优选利用通过检测剂附着荧光物质而检测荧光来执行的荧光法、或通过检测剂附着放射线同位素而检测放射线来执行的放射线法、在不标记检测剂的情况下实时测定表面的等离子共振变化的SPR(表面等离子体共振技术,surfaceplasmon resonance)方法或通过将SPR系统影像化而确认的SPRI(表面等离子体共振成像,surface plasmon resonance imaging)方法,但并不限定于此。

例如,上述荧光法为通过利用荧光扫描仪程序而将上述检测用抗体标签为荧光物质之后经点样而确认信号的方法,可通过应用该方法来确认结合程度。优选上述荧光物质为选自由Cy3、Cy5、聚L-赖氨酸-异硫氰酸荧光素(poly L-lysine-fluoresceinisothiocyanate,FITC)、罗丹明-B-异硫氰酸盐(rhodamine-B-isothiocyanate,RITC)、罗丹明(rhodamine)和PE(藻红蛋白,Phycoerythrin)组成的组中的一个以上,但并不限定于此。与荧光法不同,上述SPR系统能够实时分析抗体的结合程度,而无需用荧光物质来标记样本,但具有无法同时进行多方面的样本分析的缺点。在SPRI的情况下,具有如下缺点:虽然可利用微排列方法来同时进行多方面的样本分析,但探测强度较低。

此外,本发明的肺癌诊断用试剂盒进一步可包括:与酶进行发色反应的基质;以及能够去除未结合的蛋白质等并仅保留已结合的生物标志物的清洗液或洗提液。为了分析而所使用的样本包括活体样本,该活体样本能确认可与血清、尿、眼泪、唾液等正常状态相区别的疾病特异性多肽链。优选地,能够从生物液体样本例如血液、血、血浆测定该疾病特异性多肽链,更优选地,能够从血清测定该疾病特异性多肽链。样本可以以增加生物标志物的探测敏感度的方式准备,例如,从患者获取的血清样本可利用阴离子交换色谱法、亲和度色谱法、尺寸排阻色谱法(size exclusion chromatography)、液体色谱法、循序提取(sequential extraction)或凝胶电泳来进行前处理,但并不限定于此。

作为另一实施例,本发明的肺癌诊断用试剂盒可包括:至少六个容纳区域;以及六种以上的生物标志物,分别被容纳在上述至少六个容纳区域中,并与已设定的独立的生物标志物特异性结合,此时,上述六种以上的抗生物标志物抗体包含分别与独立的生物标志物CEA、HE4、ApoA2、TTR、sVCAM-1和RANTES进行特异性结合的抗体。

并且,本发明提供一种生物分子聚集在固体基质中的肺癌诊断用生物芯片,其中,该生物分子能够与包含在上述复合生物标志物群中的各个独立的生物标志物进行特异性结合。本发明的生物芯片可包括与上述独立的生物标志物进行特异性结合的抗体,以测定用于在肺癌患者和正常人中具有表达差异的上述独立的生物标志物,并且可包括两种以上的上述特异性抗体的组合。

上述生物分子选自由低分子化合物、配位体、适体、肽、聚肽、特异性结合蛋白质、高分子物质和抗体等组成的组,如果是能够与上述蛋白质进行特异性结合的物质则均可使用,优选使用抗体或适体,但并不限定于此。

优选上述抗体使用多克隆抗体或单克隆抗体,更优选为使用单克隆抗体。与上述蛋白质进行特异性结合的抗体也可以通过普通技术人员所知晓的公知方法来制备,还可以购买市场上广为人知的抗体来使用。上述抗体可根据普通技术人员所知晓的现有方法将作为免疫原的蛋白质注射到外部宿主中来制备。外部宿主包括白鼠、鼠、羊、兔等哺乳动物。免疫原通过肌肉、腹腔内或皮下注射方法来注射,通常可与用于增强抗原性的辅助剂(adjuvant)一同注射。可通过从外部宿主定期提取并回收显示出关于效价和抗原的特异性的血清来分离抗体。

此外,本发明的生物芯片的固体基质可选自由塑料、玻璃、金属和硅组成的组,优选地,为了使上述抗体附着在该固体基质的表面上,可进行化学处理或可结合有连接分子,但并不限定于此。在本发明的生物芯片能够在样本中提取总体蛋白质并使其与生物芯片反应而容易且准确地诊断、检测及筛查肺癌。

编码到上述生物芯片的基板中的活性基团发挥用于结合上述物质的功能,可选自由胺基(amine group)、醛基(aldehyde group)、羧基(carboxyl group)和硫醇基(thiolgroup)组成的组,普通技术人员可使用作为能够将蛋白质分子结合到基板上的活性基团而众所周知的所有活性基团,但并不限定于此。

此外,根据本发明,提供一种为了对受试者进行肺癌诊断而利用复合生物标志物群的信息的方法,该方法包括以下步骤:(a)计算系统获取(1-i)从由肺癌患者和非肺癌患者的人群构成的样本群的生物样本中测定到的肺癌诊断用复合生物标志物群的每个独立的生物标志物的表达量数据、或者(1-ii)从上述样本群中测定到的上述每个独立的生物标志物的表达量数据和上述样本群的年龄,并对上述样本群的上述每个独立的生物标志物的表达量数据进行前处理,在(2-i)从作为上述经前处理的数据的上述样本群的测定数据、或者(2-ii)从上述样本群的测定数据和上述样本群的年龄导出肺癌判断模型的状态下,获取(3-i)从上述受试者的生物样本中测定到的上述肺癌诊断用复合生物标志物群的每个独立的生物标志物的表达量数据、或者(3-ii)从上述受试者中测定到的上述每个独立的生物标志物的表达量数据和上述受试者的年龄;以及(b)上述计算系统对上述受试者的上述每个独立的生物标志物的表达量数据进行前处理,并利用(4-i)作为上述经前处理的数据的上述受试者的测定数据、或者(4-ii)上述测定数据和上述受试者的年龄,从上述肺癌判定模型判定上述受试者的肺癌发病与否。即,其中,上述肺癌判定模型将上述样本群的测定数据和属于上述标准组的人员的年龄作为独立变量。

在一实施例中,上述肺癌判定模型可以是如前述的逻辑回归模型。此外,根据一实施例,上述(b)步骤中的上述前处理可包括将上述每个独立的生物标志物的表达量中的至少一部分变换为对数(log10)的计算。

并且,根据本发明,还提供一种计算系统,其执行为了诊断前述的受试者的肺癌而利用复合生物标志物群的信息的上述方法。

图11是概要性地表示为了诊断肺癌而利用复合生物标志物群的信息的计算系统100的结构。参照图11,图示了计算系统100和作为其硬件结构要素的通信部110及处理器120。

在此,通信部110获取(1-i)从由肺癌患者和非肺癌患者的人群构成的样本群的生物样本中测定到的肺癌诊断用复合生物标志物群的每个独立的生物标志物的表达量数据、或者(1-ii)从上述样本群中测定到的上述每个独立的生物标志物的表达量数据和上述样本群的年龄,并对上述样本群中的上述每个独立的生物标志物的表达量数据进行前处理,在(2-i)从作为上述经前处理的数据的上述样本群的测定数据、或者(2-ii)从上述样本群的测定数据和上述样本群的年龄导出肺癌判断模型的状态下,获取(3-i)从上述受试者的生物样本中测定到的上述肺癌诊断用复合生物标志物群的每个独立的生物标志物的表达量数据、或者(3-ii)从上述受试者中测定出的上述每个独立的生物标志物的表达量数据和上述受试者的年龄。

此外,处理器120对上述被试者的上述每个独立的生物标志物的表达量数据进行前处理,并利用(4-i)作为上述经前处理的数据的上述受试者的测定数据、或者(4-ii)上述测定数据和上述受试者的年龄,从上述肺癌判定模型判定上述受试者的肺癌发病与否。

如此,根据本发明的计算系统100执行如前所述的、为了对被试者进行肺癌诊断而利用复合生物标志物群的信息的方法。

基于上述实施例,普通技术人员应能明确理解,本发明也可以以多种实施方式实施这一点。作为一实施例,在本说明书中,作为判定肺癌的方式利用了逻辑回归模型,但如果是用于说明二进制应变数的统计模型则可应用任何模型。处理这种统计模型的部分可以以能够通过多种计算机结构要素执行的程序指令的形式实现。在本说明书中,为了处理这种统计模型而利用了R统计包,但普通技术人员应能理解,如果是SPSS、SAS、Mathematica等其它统计软件、或能够执行导出可实现这种统计方法的程序设计语言等逻辑回归模型时所需要的运算,则可使用任何软件。这些统计模型可以以可通过多种计算机结构要素执行的程序指令的形式实现而存储在计算机可读存储介质中。上述计算机可读存储介质可单独或组合包括程序指令、数据文件、数据结构等。存储在上述计算机可读存储介质中的程序指令也可以是为了本发明而特别设计并构成的指令或公知而能够使用的指令。作为计算机可读存储介质的例,包括如硬盘、软盘、磁带的磁介质、如只读存储光盘(CD-ROM)、数字多功能光盘(DVD)的光存储介质、如光磁软盘(floptical disk)的磁-光介质(magneto-opticalmedia)以及如只读存储器(ROM)、随机存取存储器(RAM)、闪存等的以存储并执行程序指令的方式特别构成的硬件装置。在程序指令的例中,不仅包括如由编译器编译的机器代码,而且还包括因使用解释程序等而能由计算系统执行的高级语言代码。上述硬件装置可以以为了执行根据本发明的处理而作为一个以上的软件模块来运行的方式构成,反过来也相同。上述硬件装置可包括中央处理器(CPU)或如CPU的处理器,上述中央处理器被构成为与用于存储程序指令的ROM/RAM等的存储器相结合并执行存储在上述存储器中的指令,并且上述硬件装置可包括能够与外部装置收发信号的通信部。此外,上述硬件装置可包括用于传递并接收由开发者编成的指令的键盘、鼠标和其它外部输入装置。

此外,在前述的实施例中,HE4、CEA、Cyfra21-1、RANTES、TTR、sVCAM-1和ApoA2被用作必须的独立的生物标志物,但普通技术人员应能理解还具有其它独立的生物标志物。如果是可通过与这些独立的生物标志物一同使用来提高前述的统计模型(逻辑回归模型)的性能的独立的生物标志物,则目前为止在作为本发明所属技术领域的肿瘤学中与肿瘤诊断相关而被广泛利用或发现与肿瘤之间的关联性的情况下,可包括任何独立的生物标志物。在本说明书中,作为独立的生物标志物示意性地仅应用了蛋白质标记,但在必须的独立的生物标志物基础上,能利用的独立的生物标志物并不限定于此,可包括核酸标记(例如,RNA标记、DNA标记)以及其它有机物和无机物的定量等肿瘤诊断中广为人知的各种生物标志物。

以上,通过如具体结构要素等的特定事项和被限定的实施例及附图,对本发明进行了说明,但这仅为了有助于本发明的更全面的理解而提供的,本发明并不限定于上述实施例,如果是本发明所属技术领域的技术人员则能从这种记载中试图多种修正及变形。

因此,不能局限于上述说明的实施例来确定本发明的技术思想,不仅是后述的权利要求书而且与该权利要求书均等或等价变形的所有内容应属于本发明的技术思想范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号