首页> 中国专利> 一种基于机器学习的重症胰腺炎的临床预测模型构建方法

一种基于机器学习的重症胰腺炎的临床预测模型构建方法

摘要

本发明属于临床数据分析处理技术领域,公开了一种基于机器学习的重症胰腺炎的临床预测模型构建方法,基于机器学习的重症胰腺炎的临床预测模型构建方法包括:采用机器学习的方法进行数据的分析与筛选,并根据数据分析、筛选结果确定各个变量的预测贡献,并根据所述预测贡献进行数据排序,构建基于机器学习的重症胰腺炎的临床预测模型。本发明利用容易获取的生命体征和常规的血液检测指标构建预测模型,无需大量临床数据,同时利用机器学习技术筛选预测变量,能够提高AP严重程度的准确性;且本发明灵敏度高,简单方便。本发明的基于机器学习的重症胰腺炎的临床预测模型能够用于进行重症胰腺炎的早期鉴别。

著录项

  • 公开/公告号CN114974562A

    专利类型发明专利

  • 公开/公告日2022-08-30

    原文格式PDF

  • 申请/专利号CN202210513769.8

  • 发明设计人 韩勇;刘德红;黄志强;王志斌;

    申请日2022-05-12

  • 分类号G16H50/20(2018.01);G16H50/70(2018.01);G06T7/00(2017.01);G06K9/62(2022.01);

  • 代理机构重庆信必达知识产权代理有限公司 50286;

  • 代理人陈小东

  • 地址 518000 广东省深圳市福田区华富街道笋岗西路3002号

  • 入库时间 2023-06-19 16:36:32

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-10-14

    实质审查的生效 IPC(主分类):G16H50/20 专利申请号:2022105137698 申请日:20220512

    实质审查的生效

说明书

技术领域

本发明属于临床数据分析处理技术领域,尤其涉及一种基于机器学习的重症胰腺炎的临床预测模型构建方法。

背景技术

目前,急性胰腺炎(Acute pancreatitis AP)是胃肠道最常见的疾病之一,是胰腺迅速发展的炎症过程,其临床表现和严重程度各不相同。急性胰腺炎的发病率在全球每100000人中有4.9-73.4例不等。大多数患者病情轻微,预后良好,但15%-20%的AP患者病情进展,随后出现全身炎症反应综合征(systemic inflammatory response syndromeSIRS)和器官衰竭。预后差,病史率高达30%-50%。2012年修订的亚特兰大分级标准将AP分为轻度急性胰腺炎(MAP)、中度重症急性胰腺炎(MSAP)和重症急性胰腺炎(SAP)。由于重症患者病情的恶化往往在发病后12~24h,早期能够干预的时间窗相对狭窄,因此,早期识别,及时的治疗尤为重要。

目前,已经提出并接受了一系列严重性评分系统来评估和分层急性胰腺炎的严重性。其中,急性生理学和慢性健康评估II(acute physiology and chronichealthevaluation II APACHE II)系统、Ranso评分和急性胰腺炎严重程度床边指数(bedsideindex for severity in acute pancreatitis BISAP)评分、CT严重程度指数评分是常规临床实践中使用最广泛的。此外,近年来的研究证明,序贯器官衰竭评估(SOFA)评分更易于应用,是AP死亡率的可靠预测指标。然而,Ranson评分只能在住院观察48小时后获得大量临床数据才能得出结论后,限制了开始医疗干预的时间窗口;而APACHE II评分系统使用基于12个生理测量初始值的分数,使用起来非常复杂。BISAP可以很好地预测AP的严重程度、器官衰竭和死亡,与APACHE II相当,但据报道,它对死亡率和SAP的敏感性也不理想。此外,基于成像的系统在解释数据时会受到检查员个人经验的影响。

通过上述分析,现有技术存在的问题及缺陷为:现有技术需要大量的临床数据,且预测结果不准确、应用方法复杂,灵敏度不高。

发明内容

针对现有技术存在的问题,本发明提供了一种基于机器学习的重症胰腺炎的临床预测模型构建方法。

本发明是这样实现的,一种基于机器学习的重症胰腺炎的临床预测模型构建方法,所述基于机器学习的重症胰腺炎的临床预测模型构建方法包括:

采用机器学习的方法进行数据的分析与筛选,并根据数据分析、筛选结果确定各个变量的预测贡献,并根据所述预测贡献进行数据排序,构建基于机器学习的重症胰腺炎的临床预测模型。

进一步,所述基于机器学习的重症胰腺炎的临床预测模型构建方法包括以下步骤:

步骤一,获取符合标准的胰腺炎患者的数据;根据获取的数据进行数据分类;

步骤二,利用XGBoost机器学习方法对分类后的数据进行分析,并构建基于机器学习的重症胰腺炎的临床预测模型。

进一步,所述获取符合标准的胰腺炎患者的数据包括:

获取具备突发性腹痛、血清淀粉酶或脂肪酶水平高于正常范围上限的三倍、影像学显示胰周渗出、胰腺或胰周坏死中的任意两种或两种以上,且不是在疾病发作后大于36小时入院、年龄不小于18岁、既往不具备胰腺炎病史、既往不具备心衰、呼吸功能障碍或肾功能衰竭病史的胰腺炎患者的临床数据。

进一步,所述临床数据包括:患者的性别、年龄、化学检查结果和入院后12小时内的监测指标;

所述入院后12小时内的监测指标包括体温、脉搏、血压、呼吸、白细胞计数、血小板计数、红细胞压积、葡萄糖、肌酐、血尿素氮谷丙转氨酶、谷草转氨酶、总胆红素、血脂水平和血清钠离子浓度、血清钾离子浓度、血清钙离子浓度、纤维蛋白原及部分凝血酶原时间;

所述临床数据还包括:氧分压、氧气流速、吸入氧浓度、氧合指数以及CT扫描图像。

进一步,所述根据获取的数据进行数据分类包括:

从获取的数据中提取氧合指数、血清肌酐参数以及收缩压参数,并分别判断所述氧合指数是否小于预设氧合阈值,所述血清肌酐参数是否大于预设血清肌酐阈值,所述收缩压是否低于预设收缩压阈值并对液体复苏无反应,则判断对应数据为器官衰竭数据;

其次,获取的数据中提取对比增强CT扫描图像数据,判断所述对比增强CT扫描图像数据中是否存在急性胰周积液、胰腺假性囊肿、急性坏死性积液、胰腺壁坏死或其他局部并发症的图像;

最后,当且仅当获取的数据为器官衰竭数据且超过48小时,则划分为SAP组;将其余数据划分为非SAP组。

进一步,所述预设氧合阈值为300,所述预设血清肌酐阈值为170mmol/l或1.9mg/dll;所述预设收缩压阈值为90mmHg。

进一步,所述利用XGBoost机器学习方法对分类后的数据进行分析,并构建基于机器学习的重症胰腺炎的临床预测模型包括:

首先,通过XGBoost机器学习的方法筛选得到预测SAP能力排在前10位的变量,并通过非条件Logistic向前逐步回归分析进一步筛选变量;

其次,通过筛选出来的变量构建预测急性胰腺炎患者发展为重症胰腺炎的预测模型,并以列线图的形式呈现预测模型。

进一步,所述基于机器学习的重症胰腺炎的临床预测模型构建方法还包括:

通过ROC曲线评价所述基于机器学习的重症胰腺炎的临床预测模型的区分度,通过校准曲线评价所述基于机器学习的重症胰腺炎的临床预测模型的准确度。

本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述基于机器学习的重症胰腺炎的临床预测模型构建方法。

本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于执行所述基于机器学习的重症胰腺炎的临床预测模型构建方法。

结合上述的技术方案和解决的技术问题,请从以下几方面分析本发明所要保护的技术方案所具备的优点及积极效果为:

第一、针对上述现有技术存在的技术问题以及解决该问题的难度,紧密结合本发明的所要保护的技术方案以及研发过程中结果和数据等,详细、深刻地分析本发明技术方案如何解决的技术问题,解决问题之后带来的一些具备创造性的技术效果。具体描述如下:

本发明利用容易获取的生命体征和常规的血液检测指标构建预测模型,无需大量临床数据,同时利用机器学习技术筛选预测变量,能够提高AP严重程度的准确性;且本发明灵敏度高,简单方便。

第二,把技术方案看做一个整体或者从产品的角度,本发明所要保护的技术方案具备的技术效果和优点,具体描述如下:

本发明的基于机器学习的重症胰腺炎的临床预测模型能够用于进行重症胰腺炎的早期鉴别。

本发明基于实验室指标和生命体征构建了一种基于机器学习的重症胰腺炎的临床评分模型,能够在入院后的前24小时内更准确地预测SAP。

附图说明

图1是本发明实施例提供的基于机器学习的重症胰腺炎的临床预测模型构建方法流程图。

图2是本发明实施例提供的XGBoost对于预测SAP发生的变量重要性的排序示意图。

图3是本发明实施例提供的SAP发生的预测模型的列线图。

图4是本发明实施例提供的区分度评价示意图。

图5是本发明实施例提供的预测模型的校准曲线示意图。

图6是本发明实施例提供的预测模型的临床决策曲线和临床影响曲线示意图。

图7是本发明实施例提供的预测模型Bootstrap法重复采样500次的ROC曲线示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

一、解释说明实施例。为了使本领域技术人员充分了解本发明如何具体实现,该部分是对权利要求技术方案进行展开说明的解释说明实施例。

本发明实施例提供的基于机器学习的重症胰腺炎的临床预测模型构建方法包括:

采用机器学习的方法进行数据的分析与筛选,并根据数据分析、筛选结果确定各个变量的预测贡献,并根据所述预测贡献进行数据排序,构建基于机器学习的重症胰腺炎的临床预测模型。

如图1所示,本发明实施例提供的基于机器学习的重症胰腺炎的临床预测模型构建方法包括以下步骤:

S101,获取符合标准的胰腺炎患者的数据;根据获取的数据进行数据分类;

S102,利用XGBoost机器学习方法对分类后的数据进行分析,并构建基于机器学习的重症胰腺炎的临床预测模型。

本发明实施例提供的获取符合标准的胰腺炎患者的数据包括:

获取具备突发性腹痛、血清淀粉酶或脂肪酶水平高于正常范围上限的三倍、影像学显示胰周渗出、胰腺或胰周坏死中的任意两种或两种以上,且不是在疾病发作后大于36小时入院、年龄不小于18岁、既往不具备胰腺炎病史、既往不具备心衰、呼吸功能障碍或肾功能衰竭病史的胰腺炎患者的临床数据。

本发明实施例提供的临床数据包括:患者的性别、年龄、化学检查结果和入院后12小时内的监测指标。

本发明实施例提供的入院后12小时内的监测指标包括体温、脉搏、血压、呼吸、白细胞计数、血小板计数、红细胞压积、葡萄糖、肌酐、血尿素氮谷丙转氨酶、谷草转氨酶、总胆红素、血脂水平和血清钠离子浓度、血清钾离子浓度、血清钙离子浓度、纤维蛋白原及部分凝血酶原时间。

本发明实施例提供的临床数据还包括:氧分压、氧气流速、吸入氧浓度、氧合指数以及CT扫描图像。

本发明实施例提供的根据获取的数据进行数据分类包括:

从获取的数据中提取氧合指数、血清肌酐参数以及收缩压参数,并分别判断所述氧合指数是否小于预设氧合阈值,所述血清肌酐参数是否大于预设血清肌酐阈值,所述收缩压是否低于预设收缩压阈值并对液体复苏无反应,则判断对应数据为器官衰竭数据;

其次,获取的数据中提取对比增强CT扫描图像数据,判断所述对比增强CT扫描图像数据中是否存在急性胰周积液、胰腺假性囊肿、急性坏死性积液、胰腺壁坏死或其他局部并发症的图像;

最后,当且仅当获取的数据为器官衰竭数据且超过48小时,则划分为SAP组;将其余数据划分为非SAP组。

本发明实施例提供的预设氧合阈值为300,所述预设血清肌酐阈值为170mmol/l或1.9mg/dll;所述预设收缩压阈值为90mmHg。

本发明实施例提供的利用XGBoost机器学习方法对分类后的数据进行分析,并构建基于机器学习的重症胰腺炎的临床预测模型包括:

首先,通过XGBoost机器学习的方法筛选得到预测SAP能力排在前10位的变量,并通过非条件Logistic向前逐步回归分析进一步筛选变量;

其次,通过筛选出来的变量构建预测急性胰腺炎患者发展为重症胰腺炎的预测模型,并以列线图的形式呈现预测模型。

本发明实施例提供的基于机器学习的重症胰腺炎的临床预测模型构建方法还包括:

通过ROC曲线评价所述基于机器学习的重症胰腺炎的临床预测模型的区分度,通过校准曲线评价所述基于机器学习的重症胰腺炎的临床预测模型的准确度。

下面结合具体实施例对本发明的技术方案做进一步说明。

1、对象与方法

1.1数据来源

数据来自期刊《PLOS one》,它是一个非赢利的、可开放获取原始数据的期刊,期刊网址(https://journals.plos.org/plosone/),网站允许用户免费下载原始数据。根据知识共享署名许可条款,在注明原始作者和来源的前提下,可不受限制地使用、分发和复制文章及相关数据;本发明中引用了PLOS one数据包。

1.2对象

本发明为单中心横断面研究。连续性收集2008年1月至2013年6月间在华中科技大学同济医学院附属协和医院胰腺外科诊断胰腺炎患者,共1308名。(1)纳入标准:急性胰腺炎的诊断标准符合以下三个标准中的两个或两个以上:①突发性腹痛;②血清淀粉酶或脂肪酶水平高于正常范围上限的三倍;③影像学研究显示胰周渗出、胰腺或胰周坏死。(2)排除标准:①在疾病发作后大于36小时入院的患者;②年龄小于18岁的患者;③既往有胰腺炎病史的患者;④既往有心衰、呼吸功能障碍或肾功能衰竭病史的患者。最终603名患者纳入研究。原始研究获得了获华中科技大学同济医学院联合医院伦理委员会批准,所有参与治疗的患者在开始任何治疗前均提供知情书面同意书。本发明为数据二次分析,不再需要需要伦理批准。

1.2方法

1.2.1临床资料收集

通过氧分压/吸氧浓度计算氧合指数。在动脉血气分析中测量氧分压,并通过氧气流速计算吸入氧浓度。临床数据,包括患者的性别、年龄、化学检查结果和入院后12小时内的监测指标,包括体温、脉搏、血压、呼吸、白细胞计数、血小板计数、红细胞压积、葡萄糖、肌酐、血尿素氮(BUN)谷丙转氨酶、谷草转氨酶。总胆红素、血脂水平和血清钠离子浓度、血清钾离子浓度、血清钙离子浓度、纤维蛋白原及部分凝血酶原时间。

1.2.2急性胰腺炎分组

根据2012年修订的亚特兰大急性胰腺炎分类标准,患者分为三组:MAP、MSAP和SAP。器官衰竭的标准如下:(1)呼吸衰竭:氧合指数(OI)小于300;(2)肾功能衰竭:血清肌酐水平大于170mmol/l或1.9mg/dll;心衰:收缩压(SBP)低于90mmHg,对液体复苏无反应。通过回顾性分析患者住院期间的对比增强CT扫描图像,确定局部并发症,包括是否存在急性胰周积液、胰腺假性囊肿、急性坏死性积液和胰腺壁坏死。几乎所有患者在症状出现72小时后都进行了对比增强CT扫描,重症患者每一周重复一次。器官衰竭超过48小时的患者被归类为SAP患者。器官衰竭时间少于48小时或有局部并发症的患者被归类为MSAP。无器官衰竭和无局部并发症的患者被归类为MAP。本发明的主要目的是在疾病早期鉴别重症胰腺炎;因此,根据是否存在重症胰腺炎进行分组,重症胰腺炎组(SAP)和非重症胰腺炎组(非SAP),中度重症急性胰腺炎(MSAP)和轻度急性胰腺炎(MAP)被视为非重症胰腺炎组(非SAP)。

1.3机器学习

机器学习越来越多地被用于建立医学领域的风险预测模型。机器学习算法定义为在训练经验的指导下搜索大量候选程序,找到一个优化性能指标的程序。与传统的统计方法相比,它主要应用于迭代学习来自通过计算机算法获得的大量数据。在极限梯度提升(XGBoost)系统中实现的梯度树提升方法是一种有效的机器学习方法,可以组合较弱预测模型以建立更可靠的预测模型。XGBoost目前机器学习的一种新型的常用方法,在训练过程中,它可以在现有决策树的基础上通过梯度提升生成新的决策树,以便更好地预测结果。因此,经过训练,形成了由一系列决策树组成的风险预测系统。在应用过程中,预测的风险输出是每个决策树的累积得分,代表预测结果的概率。XGBoost提供了每个变量的重要性分数,表示该变量用于在所有树中分布数据的相对次数。本发明根据每个变量的预测贡献对这些变量进行排名。

1.4统计学方法

采用R软件(http://www.R-project.org,The R Foundation)和易侕软件(http://www.empowerstats.com,X&Y Solutions,Inc,Boston,MA)软件进行统计学数据分析。为了减少因缺失协变量而导致的偏差,不能反映建模过程中目标样本的统计效率,本发明中的缺失数据采用多重插补。服从正态分布的计量资料以均数加减标准差表示,两组间比较采用t检验。不服从正态分布计量资料以M(1/4,3/4)表示,两组间比较采用Wilcoxon秩和检验。计数资料以N(%)表示,组间比较进行卡方检验。

首先通过XGBoost机器学习的方法筛选出诊断SAP能力排在前10位的变量,然后在此基础上通过非条件Logistic向前逐步回归分析进一步筛选变量(P<0.1)。通过筛选出来的变量建立诊断急性胰腺炎患者发展为重症胰腺炎的预测模型,并以列线图的形式呈现预测模型。通过ROC曲线评价模型的区分度,通过校准曲线评价模型的准确度,通过临床决策曲线和临床意义曲线评价模型的临床应用价值。然后通过Bootstrap法重复采样500次对模型进行内部验证。所有的分析均遵从TRIPOD声明。P<0.05为差异具有统计学意义。

2.1一般资料:符合纳排标准的共603例急性胰腺炎患者,男382例,女223例;年龄18~90岁,平均年龄(46.9±14.4)岁。重症胰腺炎患者103例,占17.08%。

2.1.1 SAP组与非SAP组人口学及临床特征的比较。

SAP组与非SAP组之间比较,患者的年龄、收缩压等临床特征差异无统计学意义(P>0.05),与非SAP组相比,SAP组的患者男性性别比例偏大(P=0.042),收缩压及舒张压均偏高(P<0.05),SAP组的患者心率、呼吸次数、白细胞计数偏高(P<0.05)。然而,SAP患者的红细胞比积、氧合指数及血小板较非SAP组低(P<0.05)。见表1.

表1.重症胰腺炎与非重症胰腺炎患者人口学及临床特征的比较

2.1.2 SAP组与非SAP组生化、血气分析及凝血指标的比较。

SAP组与非SAP组之间的总胆红素、谷草转氨酶、谷丙转氨酶、钠离子浓度等生化指标差异无统计学意义(P>0.05)。与非SAP组相比,SAP组的患者血糖、尿素氮、肌酐、钾离子、甘油三酯、纤维蛋白原等指标偏高,凝血酶原时间、部分活化凝血酶原时间延长(P<0.05)。而与非SAP组相比,SAP组患者钙离子、氧分压、二氧化碳分压等水平偏低,PT时间缩短(P<0.05)。见表2.

表2.重症胰腺炎与非重症胰腺炎患者生化、血气分析及凝血指标的比较

2.2通过机器学习XGBoost对变量进行筛选

通过机器学习XGBoost的方法对所有人口学、临床特点、生化指标、免疫指标等候选变量进行初步筛选。结果提示,根据诊断GMT形成的重要性进行排序,排在前10位的变量依次为:肌酐,乳酸脱氢酶,钙离子,剩余碱,呼吸频率,氧合指数、二氧化碳分压、氧分压、心率、血小板。见图2。

2.3 Logistic逐步回归方法对诊断GMT形成变量的进一步筛选

对上述机器学习筛选出的10个变量,将通过logistic逐步回归分析的方法继续深入筛选有意义的变量,回归分析结果中,P<0.1的变量被筛出。从表4中可以看出,经logistic逐步回归分析后,共5个变量被筛出,分别为肌酐,乳酸脱氢酶,呼吸频率,心率与SAP发生呈正相关,血小板计数、钙离子,剩余碱、氧合指数与其呈正相关关系。通过各个回归系数可以得出这八个变量联合预测SAP发生的方程为:logit(SAP)=-2.33527+0.01793*心率+0.07975*呼吸频率-0.00586*血小板计数+0.00235*乳酸脱氢酶+0.01561*肌酐-1.10241*钙离子浓度-0.08211*剩余碱-0.00766*氧合指数。见表3.

表3.Logistic逐步回归分析对变量的筛选

2.4重症胰腺炎发生的预测模型的列线图呈现

基于肌酐,乳酸脱氢酶,钙离子,剩余碱,呼吸频率,氧合指数、心率、血小板这8个变量,建立诊断SAP发生的诊断模型的列线图。从图3中可以看出,当模型建立后,症状发生3天内就诊的急性胰腺炎患者,通过入院12小时内检测和观察肌酐,乳酸脱氢酶,钙离子,剩余碱,呼吸频率,氧合指数、心率、血小板等8个变量,就可以根据列线图预测出该患者出现重症胰腺炎的风险。例如,一位患者心率为120次/分,呼吸频率25次/分,血小板200*10^9/L,乳酸脱氢酶1000(U/L),血肌酐400μmol/L,钙离子2.0mmol/L,剩余碱-10,氧合指数150,通过查找列线图,上述指标总得分85分左右,对应的SAP发生的风险超过90%(图3)。

2.5预测模型的评价

2.5.1模型的区分度评价

通过ROC曲线及曲线下面积评价模型的区分度。研究结果发现,肌酐,乳酸脱氢酶,钙离子,剩余碱,呼吸频率,氧合指数、心率及血小板联合预测急性胰腺炎患者出现重症胰腺炎的风险模型的ROC曲线下面积(AUC)为0.916,95%CI(0.887,0.944),提示本联合预测模型预测SAP发生具有较好的区分度。模型的最佳临界点为-1.1625,最佳临界点的灵敏度77.67%,特异度91.2%,阳性预测值64.52%,阴性预测值95.20%。(图4,表6)

表6.预测模型的最佳临界点及敏感性、特异性和预测值

2.5.2模型的校准度评价

通过校准曲线评价联合预测模型预测SAP发生风险和SAP真实发生的关系。研究结果提示:联合预测模型的预测SAP发生预测值与SAP发生的实测值有较好的一致性(Hosle检验,P=0.593),说明本发明的列线图诊断模型具有较可靠的诊断能力,图5.

2.5.3模型的临床价值评价

本发明通过临床决策曲线和临床影响曲线对预测模型的临床使用价值进行评价。结果显示:黑线代表当没有患者被认为患有SAP时的净收益。相比之下,浅灰色线代表所有患者都被认为患有SAP的净收益。模型曲线中“无治疗线”(黑线)和“全部治疗线”(浅灰线)之间的面积表示模型的临床效用。模型曲线离黑色和浅灰色线越远,列线图的临床应用效果越好。具体来说,如果预测模型中患者的阈值概率为40%,则净收益约为45%,相当于100名急性胰腺炎患者使用本预测模型预测为重症胰腺炎并进行相应治疗,有45人能从中获益并不损伤任何其他人的利益。临床影响曲线中红色的线表示SAP高风险曲线,蓝色的线表示发生了SAP的高风险曲线,两者越接近,表示模型的预测高风险与实际风险越接近。结合临床决策曲线和临床影响曲线的结果,提示诊断模型预测SAP形成概率在0.2-0.4之间,模型的临床意义较大。(图6)

2.6预测模型的内部验证

因本发明所纳入的样本量较少,且本发明为单中心研究,因此未对研究人群随机分成两部分进行内部验证或者通过住院先后时间分两组进行外部验证。本发明采用Bootstrap法重复采样500次做内部验证。经过Bootstrap法重复采样500次后,得出平均曲线下面积0.917,95%CI(0.8887,0.9424),与原模型得出的AUC 0.916基本一致,提示本发明所得预测模型经内部验证后仍然成立,具有就好的临床上推广价值。

二、应用实施例。为了证明本发明的技术方案的创造性和技术价值,该部分是对权利要求技术方案进行具体产品上或相关技术上的应用实施例。

本发明将所述基于机器学习的重症胰腺炎的临床预测模型构建方法应用于计算机设备,计算机设备包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行基于机器学习的重症胰腺炎的临床预测模型构建方法。

本发明将基于机器学习的重症胰腺炎的临床预测模型构建方法应用于计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行基于机器学习的重症胰腺炎的临床预测模型构建方法。

本发明将基于机器学习的重症胰腺炎的临床预测模型构建方法应用于信息数据处理终端。

早期识别可能发展为SAP的患者对于指导治疗意义重大。为了解决这个问题,国内外的研究者提出了多种评分系统。其中,急性生理学和慢性健康评估II(acute physiologyand chronic health evaluation II APACHE II)系统、Ranso评分和急性胰腺炎严重程度床边指数(bedside index for severity in acute pancreatitis BISAP)评分、CT严重程度指数评分[早期识别可能发展为SAP的患者对于指导治疗意义重大。为了解决这个问题,国内外的研究者提出了多种评分系统。其中,急性生理学和慢性健康评估II(acutephysiology and chronic health evaluation II APACHE II)系统、Ranso评分和急性胰腺炎严重程度床边指数(bedside index for severity in acute pancreatitis BISAP)评分、CT严重程度指数评分是常规临床实践中使用最广泛的。此外,近年来的研究证明,序贯器官衰竭评估(SOFA)评分更易于应用,是AP死亡率的可靠预测指标。然而,Ranson评分只能在住院观察48小时后获得大量临床数据才能得出结论后,限制了开始医疗干预的时间窗口;而APACHE II评分系统使用基于12个生理测量初始值的分数,使用起来非常复杂。BISAP可以很好地预测AP的严重程度、器官衰竭和死亡,与APACHEII相当,但据报道,它对死亡率和SAP的敏感性也不理想。此外,基于成像的系统在解释数据时会受到检查员个人经验的影响。这些评分对于SAP预测或具有延时性,或缺乏足够的研究证据,均不够完善。鉴于目前AP严重程度预测系统的局限性,本发明试图开发一种基于实验室指标和生命体征的评分模型,以便在入院后的前24小时内更准确地预测SAP。本发明通过机器学习和logistic逐步回归方法在容易获取的生命体征和常规的血液检测指标中筛选出联合诊断重症急性胰腺炎发生的8个指标,分别为肌酐,乳酸脱氢酶,钙离子,剩余碱,呼吸频率,氧合指数、心率及血小板,并通过联合诊断方程和列线图呈现诊断模型,分别通过ROC曲线、校准曲线及临床决策曲线和临床影响曲线对模型的区分度、校准度及临床应用价值进行评价,发现模型具有较好的诊断区分度、校准度和临床应用价值。并且通过Bootstrap法重复采样500次对模型进行内部验证,提示模型具有较好的临床推广价值。

一些报道发现血肌酐,乳酸脱氢酶、钙离子对重症急性胰腺炎有预测价值。本发明通过机器学习和逐步Logistic回归分析的方法筛选,通过联合肌酐,乳酸脱氢酶,钙离子,剩余碱,呼吸频率,氧合指数、心率及血小板等8个指标的联合,建立SAP的联合预测模型,模型曲线下面积为0.916,提示该模型具有较好的区分度。提示本发明所采用的联合预测模型具有更好的区分SAP和非GMT的能力。同时,本发明也通过校准曲线证实本发明所建立的联合诊断模型预测的SAP发生风险与SAP实际形成风险相一致,提示本模型临床使用具有较好的准确性。

2006年,纪念斯隆凯特琳癌症研究所的AndrewVickers博士在Medical DecisionMaking期刊上发文首次提出了临床决策曲线分析(Decision Curve Analysis,DCA)方法。DCA是一种评估临床预测模型、诊断试验和分子标记物的简单方法。传统的诊断试验指标如:敏感性,特异性和ROC曲线下面积仅测量预测模型的诊断准确性,未能考虑特定模型的临床效用,而DCA的优势在于它将患者或决策者的偏好整合到分析中。这种理念的提出满足了临床决策的实际需要,在临床分析中的应用日益广泛。本发明通过临床决策曲线和临床影响曲线探索本诊断模型的临床应用价值,结果发现本发明建立的SAP预测模型具有较好的临床应用价值。综合临床决策曲线和临床影响曲线的结果,当模型预测SAP发生风险概率在0.2-0.4的切点范围,模型的临床意义更为明显较大。

本发明首次报道在机器学习的基础上筛选常用临床指标建立急性胰腺炎患者发生重症急性胰腺炎的诊断模型,为临床上早期识别SAP的相关危险因素,并在入院早期预测SAP发生的风险,进而及时进行临床干预,具有重要的临床指导意义。本发明也通过列线图的方式呈现型,使得模型更易于临床推广;分别通过ROC曲线、校准曲线和临床决策曲线及临床影响曲线对建立的预测模型进行评价,明确其分区度、准确度和临床使用价值。另外,本发明通过Bootstrap法重复采样500次做内部验证,所得结果与原模型基本一致,也进一步说明本模型具有一定的推广价值。

此外,本发明基于机器学习建立了一个SAP预测评分系统,其可在入院24h对患者发生SAP风险进行预测,预测准确率高达91.2%,AUC91.6%。选用的指标为临床最容易获取的生命体征及化验指标,可操作性强。在该模型的指导下,不同年资的医生能更准确的识别SAP和治疗介入时机,并进行相关干预,改善患者预后。

应当注意,本发明的实施方式除了列线图方式外,还可以通过硬件、软件或者软件和硬件的结合来实现。例如将预测模型公式通过编程,以APP形式呈现,方便实用。是常规临床实践中使用最广泛的。此外,近年来的研究证明,序贯器官衰竭评估(SOFA)评分更易于应用,是AP死亡率的可靠预测指标。然而,Ranson评分只能在住院观察48小时后获得大量临床数据才能得出结论后,限制了开始医疗干预的时间窗口;而APACHE II评分系统使用基于12个生理测量初始值的分数,使用起来非常复杂。BISAP可以很好地预测AP的严重程度、器官衰竭和死亡,与APACHEII相当,但据报道,它对死亡率和SAP的敏感性也不理想。此外,基于成像的系统在解释数据时会受到检查员个人经验的影响。这些评分对于SAP预测或具有延时性,或缺乏足够的研究证据,均不够完善。鉴于目前AP严重程度预测系统的局限性,本发明试图开发一种基于实验室指标和生命体征的评分模型,以便在入院后的前24小时内更准确地预测SAP。本发明通过机器学习和logistic逐步回归方法在容易获取的生命体征和常规的血液检测指标中筛选出联合诊断重症急性胰腺炎发生的8个指标,分别为肌酐,乳酸脱氢酶,钙离子,剩余碱,呼吸频率,氧合指数、心率及血小板,并通过联合诊断方程和列线图呈现诊断模型,分别通过ROC曲线、校准曲线及临床决策曲线和临床影响曲线对模型的区分度、校准度及临床应用价值进行评价,发现模型具有较好的诊断区分度、校准度和临床应用价值。并且通过Bootstrap法重复采样500次对模型进行内部验证,提示模型具有较好的临床推广价值。

一些报道发现血肌酐,乳酸脱氢酶、钙离子对重症急性胰腺炎有预测价值。本发明通过机器学习和逐步Logistic回归分析的方法筛选,通过联合肌酐,乳酸脱氢酶,钙离子,剩余碱,呼吸频率,氧合指数、心率及血小板等8个指标的联合,建立SAP的联合预测模型,模型曲线下面积为0.916,提示该模型具有较好的区分度。提示本发明所采用的联合预测模型具有更好的区分SAP和非GMT的能力。同时,本发明也通过校准曲线证实本发明所建立的联合诊断模型预测的SAP发生风险与SAP实际形成风险相一致,提示本模型临床使用具有较好的准确性。

2006年,纪念斯隆凯特琳癌症研究所的AndrewVickers博士在Medical DecisionMaking期刊上发文首次提出了临床决策曲线分析(Decision Curve Analysis,DCA)方法。DCA是一种评估临床预测模型、诊断试验和分子标记物的简单方法。传统的诊断试验指标如:敏感性,特异性和ROC曲线下面积仅测量预测模型的诊断准确性,未能考虑特定模型的临床效用,而DCA的优势在于它将患者或决策者的偏好整合到分析中。这种理念的提出满足了临床决策的实际需要,在临床分析中的应用日益广泛。本发明通过临床决策曲线和临床影响曲线探索本诊断模型的临床应用价值,结果发现本发明建立的SAP预测模型具有较好的临床应用价值。综合临床决策曲线和临床影响曲线的结果,当模型预测SAP发生风险概率在0.2-0.4的切点范围,模型的临床意义更为明显较大。

本发明首次报道在机器学习的基础上筛选常用临床指标建立急性胰腺炎患者发生重症急性胰腺炎的诊断模型,为临床上早期识别SAP的相关危险因素,并在入院早期预测SAP发生的风险,进而及时进行临床干预,具有重要的临床指导意义。本发明也通过列线图的方式呈现型,使得模型更易于临床推广;分别通过ROC曲线、校准曲线和临床决策曲线及临床影响曲线对建立的预测模型进行评价,明确其分区度、准确度和临床使用价值。另外,本发明通过Bootstrap法重复采样500次做内部验证,所得结果与原模型基本一致,也进一步说明本模型具有一定的推广价值。

此外,本发明基于机器学习建立了一个SAP预测评分系统,其可在入院24h对患者发生SAP风险进行预测,预测准确率高达91.2%,AUC91.6%。选用的指标为临床最容易获取的生命体征及化验指标,可操作性强。在该模型的指导下,不同年资的医生能更准确的识别SAP和治疗介入时机,并进行相关干预,改善患者预后。

应当注意,本发明的实施方式除了列线图方式外,还可以通过硬件、软件或者软件和硬件的结合来实现。例如将预测模型公式通过编程,以APP形式呈现,方便实用。

应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号