首页> 中国专利> 基于脓毒症病人检测信息进行生存概率打分的方法及系统

基于脓毒症病人检测信息进行生存概率打分的方法及系统

摘要

本发明属于深度学习分析领域,公开了一种基于脓毒症病人检测信息进行生存概率打分的方法及系统,其中方法包括以下步骤:(S1)收集训练用数据;(S2)编制表格;(S3)建立DNN网络模型并进行训练,从而对待预测病人其临床检测检测当天的生存概率得分进行预测;(S4)构建LASSO多项线性回归拟合模型并进行训练,从而基于待预测病人其临床检测检测当天的生存概率得分,对以前天数、或往后天数的生存概率得分进行预测。本发明通过对方法的整体流程设计、及相应系统的功能模块设置等进行改进,能够从大数据分析的角度具体量化病人的情况,通过病人入院后已有的测量指标数据对病人进行生存分析,预测其生存概率得分,能够为医生提供参考。

著录项

  • 公开/公告号CN113871006A

    专利类型发明专利

  • 公开/公告日2021-12-31

    原文格式PDF

  • 申请/专利权人 华中科技大学;

    申请/专利号CN202111031322.9

  • 申请日2021-09-03

  • 分类号G16H50/30(20180101);G16H50/20(20180101);G06N3/04(20060101);G06N3/06(20060101);G06N3/08(20060101);

  • 代理机构42201 华中科技大学专利中心;

  • 代理人许恒恒

  • 地址 430074 湖北省武汉市洪山区珞喻路1037号

  • 入库时间 2023-06-19 13:29:16

说明书

技术领域

本发明属于深度学习分析领域,更具体地,涉及一种基于脓毒症病人检测信息进行生存概率打分的方法及系统,利用该方法或系统,能够对脓毒症病人进行生存预测和生存分析。

背景技术

针对一类疾病,病人的各项检测值往往蕴含大量信息。目前医生针对病人的治疗基于经验和自身对病人情况的判断,个体差异较大,无法准确评估病人当前的生存概率并进行合理的生存分析、以便给出合适的治疗方案。

脓毒症疾病,往往在病人的血检、血气分析中隐藏巨大信息。综合各种数据往往能得到相对准确的死亡率预测结果。目前现有技术是通过计算指标与生存率的相关性来建立检测指标与生存概率之间的关系,然而仅通过相关性的计算无法对生存率进行科学准确预测,也无法对患者长期生存进行进一步分析,本发明希望利用病人的检查结果对病人进行合理的生存分析,为医生进一步治疗提供理论基础,初步揭示脓毒症的病理学特征。

发明内容

针对现有技术的以上缺陷或改进需求,本发明的目的在于提供一种基于脓毒症病人检测信息进行生存概率打分的方法及系统,其中通过对方法的整体流程设计、及相应系统的功能模块设置等进行改进,能够从大数据分析的角度具体量化病人的情况,通过病人入院后已有的测量指标数据对病人进行生存分析,预测其生存概率,能够为医生提供参考,以便给出更精准的治疗方案。相较于现有技术往往需要医生依靠自身经验给出判断与治疗方案,本发明基于数据分析与深度学习对病人情况进行判定,可以为医生提供参考、建议,开辟了一种区别于传统的新途径。

为实现上述目的,按照本发明的一个方面,提供了一种基于脓毒症病人检测信息进行生存概率打分的方法,其特征在于,包括以下步骤:

(S1)针对预先已知结局是死亡还是治愈出院的患有脓毒症疾病的病人,收集他们入院后的临床检查结果作为训练用数据;

其中,所述临床检查结果选自血检结果和血气分析结果,对应血检各项临床检测指标和血气分析各项临床检测指标中的至少一项指标;

(S2)根据训练用数据,编制表格;该表格设有病人编号列、检测天数信息列、结局信息列及临床检测结果列;其中,所述病人编号列用于存储对象病人所对应的病人编号;所述检测天数信息列用于存储临床检测当天所对应的天数编号;所述结局信息列用于存储病人的结局信息;所述临床检测结果列又包括若干个临床检测结果子列,每一个临床检测结果子列对应一项临床检测指标,用于存储该项临床检测指标的检测结果;

该表格中的每一行用于代表已知结局的某一个病人在某一天的临床检测结果;

(S3)建立DNN网络模型,利用所述表格中的每一行数据,以该行中临床检测结果列的数据作为输入、并以该行中结局信息列的数据为标签,对该DNN网络模型进行训练,使训练后的DNN网络模型能够以某一病人的临床检查结果为输入,预测该病人临床检测当天的生存概率得分;从而对于入院后进行过至少一次临床检测的待预测病人,利用DNN网络模型,对待预测病人其每一次进行临床检测检测当天的生存概率得分进行预测;

(S4)构建LASSO多项线性回归拟合模型,基于训练用数据,利用所述DNN网络模型得到的病人某一天的生存概率得分对该LASSO多项线性回归模型训练,拟合天数编号-生存概率得分关系,使训练后的LASSO多项线性回归拟合模型能够预测某一位病人每一天的生存概率得分;从而利用所述LASSO多项线性回归拟合模型,基于步骤(S3)得到的待预测病人其每一次临床检测检测当天的生存概率得分,对该待预测病人其临床检测检测当天以前天数、或往后天数的生存概率得分进行拟合预测。

作为本发明的进一步优选,所述步骤(S4)还包括对于所述待预测病人绘制其生存概率得分随天数变化的生存曲线,该生存曲线同时也涵盖了临床检测检测当天的生存概率得分经LASSO多项线性回归拟合模型处理得到的拟合值。

作为本发明的进一步优选,所述DNN网络模型和所述LASSO多项线性回归拟合模型在测试时,还通过调整ROC曲线AUC数值对模型参数进行调整。

作为本发明的进一步优选,所述步骤(S2)中,所述天数编号是以结局当天为第0天计,往前所对应的天数。

作为本发明的进一步优选,所述步骤(S2)中,当病人的结局为治愈出院,则所述结局信息列中记为0;当病人的结局为死亡,则所述结局信息列中记为1。

作为本发明的进一步优选,所述步骤(S2)还包括:

当所述表格中存在某一位病人某一天没有做临床检查,则将表格中同一天数编号下的其他病人每个临床检测指标检测结果的平均值分别作为该病人这一天的临床检测结果,从而对表格进行补全。

作为本发明的进一步优选,所述步骤(S3)中,所述DNN网络模型包括依次相连的三个细节结构,其中:

第一个细节结构为输入层,用于输入病人各项检测指标数值;

第二个细节结构为隐藏层,该隐藏层包含一个密集层,该密集层包括128个神经元,激活函数为ReLU激活函数;

第三个细节结构为输出层,该层含有两个神经元,激活函数为Softmax激活函数,分别用于输出生存概率得分和死亡概率得分;其中,对于生存概率得分,越靠近0表示生存率越高,越靠近1表示生存率越低。

作为本发明的进一步优选,所述步骤(S4)中,所述LASSO多项线性回归拟合模型包括依次相连的两个细节结构和LASSO回归模型,其中:

第一个细节结构用于将每一个病人天数编号作为输入进行维度为100的多项式特征构造,得到包含病人天数编号信息的多项式特征向量;

第二个细节结构用于将多项式特征向量进行特征归一化处理,得到归一化的多项式特征向量,用于传输至所述LASSO回归模型。

按照本发明的另一方面,本发明提供了一种基于脓毒症病人检测信息进行生存概率打分的系统,其特征在于,包括:

DNN网络模型功能模块:用于对于入院后进行过至少一次临床检测的待预测病人,对待预测病人其每一次进行临床检测检测当天的生存概率得分进行预测;

LASSO多项线性回归拟合模型功能模块:用于基于所述DNN网络模型功能模块得到的待预测病人其每一次临床检测检测当天的生存概率得分,对该待预测病人其临床检测检测当天以前天数、或往后天数的生存概率得分进行拟合预测。

通过本发明所构思的以上技术方案,与现有技术相比,本发明中的基于病人检测信息对脓毒症患者生存概率进行打分的预测分析方法及系统,针对脓毒症这一疾病,从病人临床检查结果中挖掘信息,预测得到生存概率得分,并能够进一步对病人进行生存分析,得到随入院天数变化的生存概率得分变化趋势图,可进一步为医生确定病人每一天的治疗方案提供建议和指导。脓毒症作为入住重症监护病房的主要原因,其症状本身及其相关全身炎症反应综合征可导致多器官功能障碍甚至死亡,而由于疾病本身复杂性和相关重要介质过多,导致根据临床数据无法精准判断目前患者生存情况和病情趋势;本发明结合深度学习,结合病人检测指标大数据对脓毒症存活率进行分析预测,将检测指标与病人生存率紧密结合,达到合理准确预测病人生存概率,同时能够反应病人生存情况和趋势,对病人预后生存时间分析和疾病治疗具有较大指导意义,有助于揭示病人临床特征与生存率之间的关联。

脓毒症作为由感染引起的全身炎症反应综合征,临床上被证实有细菌存在或有高度可疑感染灶,其发病后发展发生遵循自身的病理过程和规律,病人的生存率和生存分析对于疾病的治疗具有重大意义,由于疾病本身复杂性,临床治疗过程中将进行多项指标的检查,目前传统技术大多仅考虑多项指标与疾病生存率之间的线性相关性,无法实现准确的生存分析和预后预测,由于大数据时代的到来,激发深度学习为代表的人工智能的高速发展,本发明基于深度学习算法,对脓毒症涉及的至少一项检测指标进行合理分析,以实现准确预测病人生存率,为病人的生存分析和预后生存时间预测提供理论基础,以辅助医生进行更为合理的治疗。

附图说明

图1是本发明基于脓毒症病人检测信息对病人进行生存率预测和生存分析系统的流程示意图。

图2是本发明最后确定模型对于测试集病人生存概率得分预测ROC曲线。

图3是本发明利用实施例1中训练得到的模型对某一待预测病人进行生存概率打分绘制得到的生存曲线(曲线呈上升趋势、越靠近1表示生存率下降,曲线呈下降趋势、越靠近0表示生存率上升)。

图4和图5为这一待预测病人所对应的多项临床检测指标结果(与天数编号相对应)。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

实施例1

如图1所示,本发明中基于病人检测信息对脓毒症进行生存分析的方法,包括以下步骤:

(1)针对预先已知结局是死亡还是治愈出院的患有脓毒症疾病的病人,收集他们入院后的临床检查结果作为训练用数据;

本实施例中通过大数据库eiCU数据收集了5912位患有脓毒症的病人组成病人队列。

可以将这些病人的结局当天记为第0天,往前的第-i天(如,第-1天、第-2天、……,i取自然数)即对应住院期间;-i即作为天数编号。当然,也可以将这些病人的结局当天记为第j天(j例如可以取任意整数),只要每一位病人的天数编号原则保持一致即可。

如若存在转院等特殊情况,则将病人转院后的时间作为转院前时间的延续,修改天数编号。

当病人的结局已知为治愈出院,则将结局记为0;当病人的结局已知为死亡,则将结局记为1。

(2)根据训练用数据中的临床检查结果,编制表格,每一行代表一个病人某一天的检测值,第一列为病人序号,第二列为检测天数(即,临床检测当天所对应的天数编号),第三列为病人出院时的结局(即,死亡或治愈出院),剩下每一列用于代表一项检测指标。

检测指标可以来自血检指标和血气分析检测指标,如下表表1、表2所示。

表1血检指标

表2血气分析检测指标

本实施例中采用的是表1、表2所示的全部临床检测指标(实际应用时,也可以只采用其中1项临床检测指标,例如只采用AST指标)。

另外,若训练集中有病人某一天并没有做某一检查,即某一行某一列有空值,则用数据集表格中其余所有病人当天该指标的数值平均值对空值进行补全。

(3)构建DNN(Dynamic Neural Network)神经网络模型,该模型包括依次相连的三个细节结构,其中:

第一个细节结构为输入层,用于输入病人各项检测指标数值;

第二个细节结构为隐藏层,该隐藏层包含一个密集层,该密集层包括128个神经元,激活函数为ReLU激活函数;

第三个细节结构为输出层,该层含有两个神经元,激活函数为Softmax激活函数,分别用于输出生存概率得分和死亡概率得分。由于本实施例中结局记为0表示治愈出院,结局记为1表示死亡,因此,对于得到的生存概率得分,越靠近0表示生存率越高,越靠近1表示生存率越低。

接着,可以利用训练用数据,对DNN模型进行训练,训练后的DNN模型可以通过病人检测指标预测临床检测当天病人的生存概率得分;如此,输入每一个病人的每一天的检测指标数据,即可得到该病人当天的生存概率得分。

本实施例中,可以将步骤(2)的数据集分割为训练集和测试集,将训练集的指标数据和每个病人对应最后一天出院生存情况作为标签输入构建好的DNN模型,对DNN模型进行训练,如此即可得到当天检测指标预测病人当天生存概率得分的DNN模型;

(4)构建LASSO多项线性回归拟合模型(其中LASSO即Least absolute shrinkageand selection operator),该模型包括依次相连的两个细节结构和LASSO回归模型,其中:

第一个细节结构用于将每一个病人天数编号作为输入进行维度为100的多项式特征构造,得到包含病人天数编号信息的多项式特征向量;

第二个细节结构用于将多项式特征向量进行特征归一化处理,得到归一化的多项式特征向量,用于传入至LASSO回归模型。

在训练阶段,针对训练集数据,在LASSO多项线性回归拟合模型中,使用DNN模型预测得到的生存概率得分作为标签,每一个病人都可以通过得到该病人每一天的生存趋势,可以通过该生存趋势制生存曲线。

在本实施例中,将测试集的指标数据通过训练好的DNN模型进行每一天对应的生存概率得分预测,再将生存概率得分和对应的时间(即,对应的天数编号)输入构建好的LASSO多项线性回归拟合模型,进行每一个病人的生存曲线拟合,可以得到病人每一天的生存概率得分。

类似的,对于需要预测的病人(即,待预测病人),结合该病人入院后的临床检查结果,就能够通过上述模型对需要预测的病人进行生存趋势的预测。例如针对某一位病人,可以将临床检测当天所对应的天数编号和对应的检测指标结果,以及想要预测的日期所对应的天数编号输入上述模型,输出即为想要预测的日期的生存概率得分(也就是说,得到每一位病人通过已知天数和对应的生存概率得分训练好的生存趋势后,即可通过输入需要预测的天数,得到对应日期的生存概率得分的输出;同时,通过DNN模型直接得到的临床检测当天的生存概率得分也会经过LASSO多项线性回归拟合模型的拟合处理,得到拟合值)。进一步的,可以通过该生存概率得分和对应天数绘制生存曲线,进行生存分析,并可进一步为医生提供建议和指导(例如,若生存率呈现上升趋势(由于生存概率得分越靠近0表示生存率越高,此时生存概率得分将呈下降趋势),则表明医生针对该病人所采用的疗法较为合适,可以继续使用;若生存率呈现下降趋势,则可建议医生将治疗方案的侧重点转移至优先将病人检测指标调整至正常范围,找到提升生存率的治疗方案)。如果需要预测的病人有明确的出院时间,则以最后的出院日期记为第0天,从实际住院开始到该出院日期即为住院期间;如若需要预测的病人没有明确的出院时间,则以该病人所有对应检测指标的最后一天为第-N天(N为预先设定的正整数;例如可以取5),从实际住院开始到最后一次检测往后第N天即为住院期间。

另外,针对上述实施例中所构建的模型,还可以通过测试集病人的结局作为标签,绘制ROC曲线,通过提高AUC为目标,对DNN模型训练预测过程和LASSO多项式线性回归拟合模型训练预测过程进行迭代并修改参数,直至AUC值不再提高位置,得到最佳预测模型。

本发明基于病人检测信息对脓毒症进行生存预测和生存分析的方法及对应的系统,是针对病人提供检测数据,通过大数据建模对病人指标进行生存概率得分预测,并可进一步绘制生存曲线。

以某一待预测病人为例,其各项临床检测指标结果如图4、图5所示,这位病人(病人ID:2631147)在天数编号(dis_day)为第-5天、第-4天、第-3天、第-2天时分别进行了四次临床检测,各项检测指标的结果如图4、图5所示。利用上述实施例1得到的预测系统绘制生存分析结果图,如图3所示。

本发明中关于DNN模型与LASSO模型,其它未详细说明的地方均可参照现有技术,如D.Ciregan,U.Meier and J.Schmidhuber,"Multi-column deep neural networks forimage classification,"2012IEEE Conference on Computer Vision and PatternRecognition,2012,pp.3642-3649,doi:10.1109/CVPR.2012.6248110和TibshiraniR.Regression Shrinkage and Selection via the Lasso.Journal of the RoyalStatistical Society.Series B,Methodological.1996;58(1):267-88.。

本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号