首页> 中国专利> 活动性结核病标志物、试剂盒、检测方法及模型构建方法

活动性结核病标志物、试剂盒、检测方法及模型构建方法

摘要

本发明提供了活动性结核病标志物、试剂盒、检测方法及模型构建方法,其特征在于,活动性结核病诊断标志物为血液样本中的血浆蛋白生物标志物,所述血浆蛋白生物标志物为包括APOA4蛋白质、CFH蛋白质、CFHR5蛋白质、FGG蛋白质、MBL2蛋白质的一种或多种的联合标志物;发明首次采用血浆蛋白来源的APOA4、CFH、CFHR5、FGG的联合标志物作为活动性肺结核检测的生物标记物,构建了活动性结核病检测的快速诊断模型,为结核病的临床诊断提供了新的方向。因此,本发明克服了现有活动性肺结核诊断检出率低、耗时长等缺点,具有特异性好、灵敏度高的特点,对活动性肺结核的辅助诊断有良好的临床应用价值。

著录项

  • 公开/公告号CN113192552A

    专利类型发明专利

  • 公开/公告日2021-07-30

    原文格式PDF

  • 申请/专利权人 上海市公共卫生临床中心;

    申请/专利号CN202110352760.9

  • 发明设计人 张舒林;何俊才;宋言峥;温子禄;

    申请日2021-03-31

  • 分类号G16B5/00(20190101);G16B40/10(20190101);G16H50/20(20180101);G16H50/50(20180101);G06K9/62(20060101);G06N20/00(20190101);

  • 代理机构31359 上海凯玛顿知识产权代理事务所(普通合伙);

  • 代理人胡薇

  • 地址 201508 上海市金山区漕廊公路2901号

  • 入库时间 2023-06-19 12:02:28

说明书

技术领域

本发明属于生物医学技术领域,更具体地,涉及蛋白质组学技术和机器学习算法,构建了涉及血浆蛋白生物标志物的活动性结核病检测模型。

背景技术

结核病(TB)迄今仍是全球的重大公共卫生问题,是单一病原体所致死亡率最高的感染性疾病,严重威胁人类的健康。据世界卫生组织(WHO)估计,在2019年全球约1000万人新感染结核病,死亡人数近140万。中国的结核现状严峻,是仅次于印度之后的第二结核大国。结核病的高发病率和死亡率,以及通过空气传播,对患者和社会都产生了相当大的负担。因此,在早期及时而准确地发现结核感染,对于结核病患者的治疗及结核病扩散流行的控制是至关重要的。目前,与结核有关的临床诊断方法均存在缺陷,如痰涂片镜检灵敏度较低,无法区分死菌活菌,且在多种环境中不适用;痰结核菌培养需要较长周期(6-8周),阳性率低(30%);胸部X射线检查难以区分肺结核和其他肺部病变;PCR检测的假阳性和假阴性率均高;结核菌素试验不能区分结核自然感染和卡介苗接种;血清结核抗体检测的灵敏度以及特异性目前还有局限。因此,仍需要发现一种特异性强的新的生物学标记物,为结核病的鉴别诊断提供快速、敏感、高效以及稳定的风险预测模型方法。

疾病状态下患者体内一些维持免疫平衡的蛋白异常表达,导致机体的免疫状态发生改变。近些年来,检测机体的一些关键分子的异常表达预测疾病风险和治疗效果评判已有所报道,研究涉及前列腺癌、肝癌、乳腺癌、肝细胞癌、白血病以及卵巢癌等。结核菌与宿主的免疫防御系统的攻防转移是结核病发生发展的关键,其过程中细菌和机体会通过调节相关蛋白的表达抑制或增强机体的免疫应答。筛选合适的蛋白分子作为结核病诊疗标志物,是目前结核病的诊断以及鉴别诊断发展的新方向。

发明内容

本发明为解决现有结核病诊断技术存在的特异性不好,灵敏度不高的问题,提供了一种基于血浆蛋白组学技术和机器学习算法的活动性结核病快速检测模型及其构建方法,对结核病检测有良好的应用价值。

本发明一方面公开了基于血浆蛋白组学技术和机器学习算法的活动性结核病快速诊断模型中所用诊断结核病的联合标志物,为血液样本中的血浆蛋白生物标志物,所述血浆蛋白生物标志物为包括APOA4蛋白质、CFH蛋白质、CFHR5蛋白质、FGG蛋白质、MBL2蛋白质的一种或多种的联合标志物。

进一步地,所述联合标志物中APOA4蛋白质的氨基酸序列如SEQ ID NO:1所示。

进一步地,所述联合标志物中CFH蛋白质的氨基酸序列如SEQ ID NO:2所示。

进一步地,所述联合标志物中CFHR5蛋白质的氨基酸序列如SEQ ID NO:3所示。

进一步地,所述联合标志物中FGG蛋白质的氨基酸序列如SEQ ID NO:4所示。

本发明另一方面公开了一种基于血浆蛋白标志物的活动性结核病检测试剂盒,其特征在于,包括全血样品中血浆提取分离相关试剂、血浆样本的蛋白质组学定量分析相关试剂、血浆样本中APOA4蛋白质、CFH蛋白质、CFHR5蛋白质、FGG蛋白质的蛋白表达水平测定相关试剂;还包括标准品,所述标准品为APOA4蛋白质、CFH蛋白质、CFHR5蛋白质、FGG 蛋白质的一种或多种。

本发明接着公开了一种基于血浆蛋白标志物的活动性结核病检测试剂盒的检测方法,其特征在于,试剂盒中的检测试剂用于测定得自受试者的血浆样品中的标志物蛋白表达水平,包括以下步骤:

a.测定得自所述受试者血浆中APOA4蛋白质、CFH蛋白质、CFHR5蛋白质、FGG蛋白质表达水平;

b.将受试者血浆中标志物蛋白表达水平与正常受试者中血浆中标志物蛋白表达水平进行对比;

c.基于步骤b做出的对比结果,其中所述受试者的血浆样品中APOA4、FGG的表达水平相对于正常人受试者的水平的下降及CFH、CFHR5的表达水平相对于正常人受试者的水平的上升指示所述受试者存在结核病。

进一步地,TMT-LC/MS用于检测受试者的血浆样品中蛋白质的表达水平,其中所述受试者的血浆样品中APOA4、FGG的表达水平相对于正常人受试者的水平的下降及CFH、CFHR5 的表达水平相对于正常人受试者的水平的上升指示所述受试者存在结核病。

进一步地,使用PRM质谱方法检测APOA4、CFH、CFHR5、FGG的表达水平。

进一步地,使用ELISA方法检测APOA4、CFH、CFHR5、FGG的表达水平。

进一步地,使用机器学习算法构建APOA4、CFH、CFHR5、FGG的活动性结核病快速诊断模型。

本发明最后公开了一种基于血浆蛋白标志物的活动性结核病检测模型的构建方法,其特征在于,使用检测算法构建APOA4、CFH、CFHR5、FGG的活动性结核病快速诊断模型;其检测算法包括以下步骤:

(1)血浆样本的收集与处理,从全血中分离血浆样本,数据采集模块用于样本数据采集,获取样本数据集;

(2)测定血浆样本,数据处理模块从样本中测定血浆蛋白生物标志物的指标,所述血浆蛋白生物标志物具体包括APOA4蛋白质、CFH蛋白质、CFHR5蛋白质、FGG蛋白质;

(3)数据模型构建模块使用神经网络的方法拟合训练集进行模型的构建,以70%的样本量作为训练集,30%的样本量作为测试集,对血浆蛋白标志物的表达进行整合分析,记录最优模型参数;同时阈值计算模块根据ROC曲线使用验证集计算模型分类的阈值,构建得到活动性结核病检测模型,其中所述受试者的血浆样品中APOA4、FGG的表达水平相对于正常人受试者的水平的下降及CFH、CFHR5的表达水平相对于正常人受试者的水平的上升指示所述受试者存在结核病。

本发明相对于现有技术而言,具有以下有益效果:

1.本发明首次采用血浆蛋白来源的APOA4、CFH、CFHR5、FGG的联合标志物作为活动性肺结核检测的生物标记物,构建了活动性结核病检测的快速诊断模型,为结核病的临床诊断提供了新的方向。因此,本发明克服了现有活动性肺结核诊断检出率低、耗时长等缺点,具有特异性好、灵敏度高的特点,对活动性肺结核的辅助诊断有良好的临床应用价值。尤其是血浆蛋白来源的APOA4是首次作为肺结核检测的生物标记物,具有重大的技术意义。

2.本发明提供了利用血中血浆蛋白来源的APOA4、CFH、CFHR5、FGG作为活动性肺结核检测的生物标记物检测活动性肺结核的检测试剂以及试剂盒,能够准确快速的对活动性肺结核进行检测以及对活动性肺结核的发病阶段进行检测,便于临床应用。

附图说明

图1为基于TMT-LC/MS的蛋白质组学定量研究结果;

(A)TB和hc之间1058个蛋白的火山分布图;红色表示上调蛋白,蓝色表示下调蛋白,灰色表示差异不显著;(B)TB与HC之间存在显著差异的114个蛋白的热图。fold change为 1.2或0.833的显著调控蛋白的基因名称。

图2为PRM对15例肝癌和15例结核病患者的7个主要标志物验证结果;

(A)A2M、(B)APOA4 CFH(C),(D)CFHR5,(E)FGB,(F)FGG,MBL2(G);数据以均数± SD表示。*P<0.05,**P<0.01,***P<0.001,ns:无显著差异。

图3为7个候选生物标志物的ELISA验证;

(A)APOA4,(B)CFH,(C)CFHR5,(D)FGB,(E)FGG,MBL2(F);数据以平均值±SD表示。*P<0.05;**P0.01;***P<0.001;****P<0.0001ns:无显著差异。

图4血浆蛋白标志物诊断结核病的ROC曲线分析;

(A)鉴别结核病与健康的蛋白标志物ROC曲线分析;

(B)鉴别结核病与非结核肺部呼吸性疾病的蛋白标志物ROC曲线分析;

(C)由APOA4、CFH、CFHR5、FGG组成的活动性结核病快速诊断模型鉴别结核与非结核的ROC曲线分析。

具体实施方式

下面用实施例来进一步说明本发明,但本发明并不受其限制。下列实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。

1.简介

本发明提供了活动性结核病快速诊断模型的联合血浆蛋白生物标志物为APOA4、CFHR5、 FGG、MBL2,其指示结核病,且可以用于准确地诊断受试者中的结核病。

2.定义

在详细阐述本发明之前,提供要在本文中使用的某些术语的定义。除非另外定义,否则在本文中使用的所有技术和科学术语具有与本领域技术人员通常理解相同的含义。

术语“受试者”意图包括,能够直接地或间接地涉及结核病的任意障碍。受试者的例子包括哺乳动物,例如,人类、非人灵长类动物、狗、牛、马、猪、绵羊、山羊、猫、小鼠、兔、大鼠和转基因的非人动物。在某些实施方案中,所述受试者是人,例如,遭受结核病的人,处于遭受结核病及其相关的风险中的人,或者潜在地能够遭受结核病相关的痴呆的人。

术语“治疗”在本文中用于表示解除、减轻或缓解受试者中的疾病的至少一种征状。例如,关于结核病,术语“治疗”包括:解除、减轻或缓解认知损害(诸如记忆和/或定向的病损)或总体功能(所有功能,包括日常生活活动)的病损,和/或减慢或逆转总体或认知损害的进行性衰退。因此,术语“治疗”也包括:在疾病的临床表现或疾病的征状之前延迟或阻止发作,和/或减少疾病征状的发展或恶化的风险。

术语“约”或“大约”通常是指在给定的值或范围的5%内,或更优选1%内。

3.结核病的血浆蛋白生物标志物

本发明涉及血浆蛋白生物标志物:与“正常”受试者相比,其被发现在患有结核病的受试者的血浆生物样品中差别地存在。如果在样品中的一种血浆蛋白生物标志物的表达水平之间的差异被确定为统计上显著的,那么该血浆蛋白生物标志物在样品之间差别地存在。统计显著性的常见试验包括、但不限于:t-检验、ANOVA、Kniskal-Wallis、Wilcoxon、Mann-Whitney 和比值比。单独的或组合的血浆蛋白生物标志物可以用于提供受试者罹患结核病的相对风险的量度。

4.测定样品中的血浆蛋白生物标志物的表达水平

通过任意合适的方法,可以测定生物样品中的血浆蛋白生物标志物的水平。可以使用任意可靠的用于测量样品中的血浆蛋白的水平或量的方法。通常,可以从生物样品检测和定量血浆蛋白,所述样品是采集受试者全血而分离得到的血浆样品,所述方法包括:蛋白定量方法(例如,串联质谱-液相色谱/质谱(TMT-LC/MS)、液相色谱-平行反应监测/质谱(LC-PRM/MS) 等)、蛋白浓度测定方法(例如,酶联免疫吸附测定(ELISA)、免疫印迹法(WB)、蛋白芯片等) 和模型构建算法(例如,逻辑回归算法、决策树、神经网络算法等)。其它示例性的技术包括聚合酶链式反应(PCR)、实时聚合酶链式反应(RT-PCR)等。

5.使用血浆蛋白生物标志物确定结核病

本发明描述的血浆生物标志物可以用于诊断试验中以评估受试者的结核病状态。疾病状态包括结核病的存在或不存在,结核病与其他肺部呼吸性疾病的区分。基于受试者的结核病状态,可以指示其它操作,包括、例如,其它诊断试验或治疗操作。

通常以测定的准确度、测定的灵敏度、测定的特异性或“曲线下面积”(AUC)(例如,在受试者操作特征(ROC)曲线下的面积)的方式,测量诊断试验的正确预测疾病状态的能力。本文中使用的准确度是错误分类的样品的比例的量度。可以将准确度计算为,正确分类的样品的总数除以样品的总数(例如在试验群体中)。灵敏度是通过试验预测为阳性的“真阳性”的量度,且可以计算为正确鉴别的结核病样品的数目除以结核病样品的总数。特异性是通过试验预测为阴性的“真阴性”的量度,且可以计算为正确鉴别的正常样品的数目除以正常样品的总数。AUC是受试者操作特征曲线下的面积的量度,所述曲线是灵敏度相对于假阳性率的图(1-特异性)。AUC越大,试验的预测值越有效。试验的实用性的其它有用的量度包括“阳性预测值”(它是试验为阳性的实际阳性的百分比)和“阴性预测值”(它是试验为阴性的实际阴性的百分比)。

下面用实施例来进一步说明本发明,但本发明并不受其限制。下列实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。

除非特别说明,以下实施例所用试剂和材料均于市购。

实施例1

从全血中分离血浆样本

用EDTA抗凝管采集活动性肺结核患者晨起空腹外周血全血,3000rcf离心15min,6小时内分离血浆至新的1.5mL离心管中。血浆样品保存于-80低温冰箱中。

实施例2

血浆样本的蛋白质组学定量分析

根据试剂盒说明,使用Pierce Top 12Abundant Protein Depletion SpinColumns Kit (Thermo,USA)去除高丰度血浆蛋白。蛋白溶液用5mM二硫苏糖醇还原,56℃消化30min,用 11mM碘乙酰胺烷基化,室温黑暗消化15min。然后加入100mM TEAB将蛋白样品稀释至尿素浓度小于2M。最后,以1:50的胰蛋白酶-蛋白质量比添加胰蛋白酶进行第一次消化,1:100的胰蛋白酶-蛋白质量比添加第二次消化4h。胰酶消化后,采用Strata X C18固相萃取柱 (Phenomenex)脱盐,真空干燥。样品肽在0.5M TEAB中重组,并用TMT试剂盒进行标记处理。用Agilent 300Extend C18色谱柱进行高效液相色谱(HPLC)分离。处理好的血浆样本分别进行TMT-LC/MS和LC-PRM/MS。

实施例3

ELISA方法测定血浆样本中蛋白表达水平

样本收集:活动性结核患者80例,健康对照76例,非结核肺部呼吸性疾病76例。

按标准操作使用人APOA4和MBL2 ELISA试剂盒(Elabscience,WuHan,CN)和人CFH,CFHR5, FGB,FGG ELISA试剂盒(Cloud-Clone Corp,WuHan,CN)检测血浆蛋白标志物的表达水平。采用GraphPad Prism 8软件中的t test or one-way ANOVA进行统计分析(P<0.05时,具有显著性差异,P<0.01时,具有极显著差异)。差异表达的血浆蛋白数据处理时以mean±SEM表示,绘制包含误差线的散点图。

实施例4

活动性结核病快速诊断模型的构建:

采用SPSS 17.0对血浆蛋白标志物的表达进行整合分析,以70%的样本量作为训练集,30%的样本量作为测试集。利用GraphPad Prism 8软件进行诊断模型的ROC曲线的绘制。由APOA4、 CFH、CFHR5、FGG组成的活动性结核病快速诊断模型在鉴别结核与非结核的灵敏度为90%,特异性为71.7%,曲线下面积(AUC)为0.87,见图4所示。

通过对包括80例结核患者、76例健康志愿者及76例非结核肺部疾病患者血浆来源的蛋白标志物的分析,发现由APOA4、CFH、CFHR5、FGG组成诊断模型有很好的诊断敏感性和不错的特异性,可为活动性结核病的鉴别诊断提供依据。

在本实施例中,基于血浆蛋白指标的结核病风险预测模型的构建方法的构建系统,包括:

数据采集模块,至少用于数据采集,获取样本数据集;

数据处理模块,至少用于从样本数据集中提取可用于构建评估模型的有效样本;

模型构建模块,至少用于将所述有效样本的不完整数据集随机分割为训练集和验证集,并使用神经网络的方法拟合训练集,记录最优模型参数;

阈值计算模块,至少用于根据ROC曲线使用验证集计算模型分类阈值。

综上所述,本发明通过检测病人血浆蛋白含量指标,然后利用建立的运算公式模型,计算各个标本值及诊断阈值,从而诊断病人是否患有活动性结核病。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号