首页> 中国专利> 一种预测妊娠期急性脂肪肝母儿不良围产期结局的方法和系统

一种预测妊娠期急性脂肪肝母儿不良围产期结局的方法和系统

摘要

本发明提供一种预测妊娠期急性脂肪肝母儿不良围产期结局的方法和系统。所述方法包括:筛选妊娠期急性脂肪肝母儿不良围产期结局高危因素并构建高危因素与不良围产期结局预测模型;其中,筛选妊娠期急性脂肪肝母儿不良围产期结局高危因素的方法包括:构建AFLP患者信息库,患者信息库中包含患者及胎儿的临床信息;对AFLP患者信息库中的临床信息进行分组,获得危险因素并确认不良围产期结局;筛选妊娠期急性脂肪肝母儿不良围产期结局高危因素。本发明可以针对所有妊娠期急性脂肪肝患者及其胎儿的不良围产期结局发生情况进行有效预测,能够为AFLP患者及其胎儿不良围产期结局的改善提供更加个性化的临床指导意见。

著录项

  • 公开/公告号CN112863666A

    专利类型发明专利

  • 公开/公告日2021-05-28

    原文格式PDF

  • 申请/专利权人 山东大学齐鲁医院;

    申请/专利号CN202110062388.8

  • 申请日2021-01-18

  • 分类号G16H50/20(20180101);G16H50/70(20180101);G16H10/60(20180101);G06N20/10(20190101);G06N20/20(20190101);

  • 代理机构37221 济南圣达知识产权代理有限公司;

  • 代理人孙维傲

  • 地址 250012 山东省济南市历下区文化西路107号

  • 入库时间 2023-06-19 11:06:50

说明书

技术领域

本发明涉及医药领域,具体涉及一种预测妊娠期急性脂肪肝母儿不良围产期结局的方法和系统。

背景技术

公开此背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而并非必然被视为承认或以任何形式暗示该信息构成已经成为本领域一般技术人员所公知的现有技术。

妊娠期急性脂肪肝(Acute fatty liver of pregnancy,AFLP)是一种罕见的产科急症,会对母儿生命安全造成严重威胁。AFLP起病急骤,常在妊娠晚期或分娩初期突然发病,因该疾病的前驱症状多种多样且均不具有特异性,所以及时准确诊断非常困难。同时,该疾病进展迅速,短时间内患者便会因肝脏广泛脂肪浸润而出现急性肝功能衰竭、肾功能损伤以及严重凝血功能障碍等。如未及时处理,还会造成产后出血、弥散性血管内凝血等不良围产期结局,甚至导致患者死亡。AFLP不仅会影响患者自身,还会对其胎儿产生严重影响。这部分患者其胎儿合并宫内窘迫、低体重儿、生长发育受限等不良围产期结局的比例明显升高,同时还会出现胎儿宫内死亡或新生儿期死亡。因此,AFLP虽发病率较低,但其母儿死亡率一度居高不下。目前,随着产科支持技术的不断进步,AFLP患者及其胎儿的死亡率已经有了明显的下降。但不可否认的是,该疾病依旧会频繁导致母儿不良围产期结局的出现。

多项研究针对AFLP发病相关的高危因素进行了研究,初产妇、多胎妊娠、男性胎儿、妊娠合并其他肝脏疾病、既往AFLP病史及子痫前期被认为与AFLP的发病密切相关。同时,有研究针对AFLP预后、致命并发症发生及围产期死亡的高危因素进行了分析。关于AFLP患者预后相关高危因素的研究已较为成熟,患者产前血清胆红素水平、凝血酶原时间、纤维蛋白原水平及血小板计数被认为与产后恢复时间密切相关;凝血酶原时间和国际标准化比值可提示致命并发症出现的风险;而流产史,血清总胆红素、纤维蛋白原降解产物及肌酐水平是围产期死亡的独立危险因素。目前,关于AFLP母儿不良围产期结局发生的高危因素分析尚处于缺乏状态。

早期准确诊断,适时终止妊娠,并在整个围产期为患者及胎儿提供多学科支持治疗被认为可以改善AFLP的预后。其中,为具有不良围产期结局高风险的母儿提供充足有效的支持治疗更能够显著改善其不良结局。这一切的基础建立在能够筛选出具有不良围产期结局高风险的患者及胎儿上。迄今为止,尚无针对母儿不良围产期结局高危因素的分析,正是由于对这类高危因素的认知有助于AFLP不良并发症的防治及母儿预后的改善,筛选出这部分高危因素的需求非常迫切。

发明内容

为了解决现有高危因素缺乏的问题,本发明提供了一种基于患者及胎儿临床信息,比如基本特征、实验室异常结果与临床表现等,用于AFLP母儿不良围产期结局高危因素筛选与验证的方法和系统,并将其用于预测妊娠期急性脂肪肝母儿不良围产期结局,以期为AFLP患者及其胎儿不良围产期结局的改善提供更加个性化的临床指导意见。本发明的方法能够高效便捷地筛选出区分度高、有效性好的AFLP母儿不良围产期结局高危因素,预测AFLP母儿不良围产期结局准确性高。

具体地,本发明的技术方案如下所述:

在本发明的第一方面,本发明提供了一种预测妊娠期急性脂肪肝母儿不良围产期结局的方法,其包括:

筛选妊娠期急性脂肪肝母儿不良围产期结局高危因素并构建高危因素与不良围产期结局预测模型;

其中,筛选妊娠期急性脂肪肝母儿不良围产期结局高危因素的方法包括:构建AFLP患者信息库,患者信息库中包含患者及胎儿的临床信息;对AFLP患者信息库中的临床信息进行分组,获得危险因素并确认不良围产期结局;筛选妊娠期急性脂肪肝母儿不良围产期结局高危因素。

在本发明的实施方式中,临床信息中应包含患者的基本特征、胎儿的基本特征、患者的临床表现、患者的实验室检查指标以及患者妊娠合并症的有无及类别信息。所述临床信息以患者或胎儿为单元进行存储,当调取患者或胎儿名字或编号或病例编码时可获得该患者或胎儿的临床信息。

在本发明的实施方式中,患者的基本特征包括但不限于:年龄、分娩史、分娩孕周、分娩方式、胎儿数、住院天数、妊娠合并症、患者预后;胎儿基本特征包括但不限于:胎儿体重、Apgar评分、生长发育情况、胎儿预后;患者临床表现包括但不限于:恶心、呕吐、黄疸、阴道流血流液、腹痛、头晕、反酸;实验室指标包括但不限于:肝功,包括谷丙转氨酶、谷草转氨酶、总胆红素、白蛋白;肾功,包括肌酐、尿素氮、碱性磷酸酶;血常规,包括血小板、血红蛋白、白细胞;凝血功能,包括纤维蛋白原、凝血酶原时间、部分凝血活酶时间;妊娠合并症包括但不限于:妊娠期高血压、妊娠期糖尿病。

在本发明的实施方式中,构建AFLP患者信息库的标准包括入组标准和出组标准;

其中,入组标准为患者临床信息需同时符合下述标准中三项及以上:

(1)患者临床信息中显示患者临床表现异常;比如具有恶心、呕吐、黄疸、阴道流血流液、腹痛、头晕、反酸等中的一项或几项;

(2)患者临床信息中显示实验室检查指标异常;比如具有以下列出的异常指标中的一项或几项:肝功异常,如转氨酶、总胆红素升高以及白蛋白下降等;肾功受损,如肌酐、尿素氮、碱性磷酸酶升高等;凝血功能障碍,如凝血酶原时间、部分凝血活酶时间延长以及纤维蛋白原水平下降等;血常规异常,如血红蛋白、血小板减少及白细胞升高等;

(3)患者临床信息中存在并发症信息;比如具有肝功能损伤、肾功能衰竭、凝血功能障碍等中的一项或几项;

(4)患者临床信息中存在辅助检查信息提示患者肝脏异常;比如肝脏活检、B超或计算机断层扫描等检查提示具有肝脏脂肪变或肝细胞小泡性脂肪变性等;

应当理解,为了便于收集获取患者及胎儿的临床信息以及便于所获取信息的连续性、可更新性及完整性,入组标准中可选地包括:患者在可完整持续获取临床信息的医疗机构完成分娩或具有确切的胎儿预后。对于已有的可调取的完整数据,该标准则是非必要的。

其中,出组标准为患者临床信息中出现下述标准中的任一项:

(1)患者临床信息中显示患者同时患有病毒性肝炎和/或其他肝脏疾病;

(2)患者临床信息中显示患者同时患有恶性肿瘤等恶性疾病。

在本发明的一些实施方式中,AFLP患者信息库中应至少包含140例患者及胎儿的临床信息。本领域技术人员知晓,数据量越大可利用的样本越丰富,则结果的可信度、准确度等越高。

在本发明的实施方式中,为便于对不同类型的数据进行有效分析,分别针对连续型随机变量及离散型随机变量采用不同方法进行了临床信息分组,具体分组方法如下所示;

针对连续型随机变量,如患者年龄、分娩孕周、谷丙转氨酶数值、血红蛋白数值等,采取受试者工作特征曲线(receiver operating characteristic curve,ROC)最优约登指数(Youden Index,YI)的方法寻找最佳临界点。约登指数=敏感度+特异度-1,选取约登指数最高值处所对应的连续型随机变量值作为最佳临界点,并利用该最佳临界点将连续型随机变量进行二分类分组,分组以0或1进行标记;举例而言,患者谷丙转氨酶的约登指数最大值为0.394,该值对应的谷丙转氨酶值为150.5U/L,将患者分为谷丙转氨酶<150.5U/L及谷丙转氨酶≥150.5U/L2组,并分别标记为0(谷丙转氨酶<150.5U/L)和1(谷丙转氨酶≥150.5U/L)进行区分;再比如,患者血红蛋白的约登指数最大值为0.405,该值对应的血红蛋白值为97.5g/L,将患者分为血红蛋白>97.5g/L及血红蛋白≤97.5g/L 2组,并分别标记为0(血红蛋白>97.5g/L)和1(血红蛋白≤97.5g/L)进行区分。

对于离散型随机变量,比如患者的分娩方式、胎儿数、临床表现、妊娠合并症等,均作为分组数据处理,即通过患者所属不同类别将患者区分为≥2组,进而针对各组以0或1或2等进行标记;举例而言,根据分娩史可将患者为初产妇和经产妇2类,进而可将这2类患者分为对应的2组,并分别标记为0(初产妇组)和1(经产妇组)进行区分;比如,根据胎儿数可为单胎和多胎2类,进而可将这2类患者分为对应的2组,并分别标记为0(单胎组)和1(多胎组)进行区分;再比如,妊娠期高血压可分为未发生妊娠期高血压和发生妊娠期高血压2类,进而可将这2类患者分为对应的2组,并可分别标记为0(未发生妊娠期高血压组)和1(发生妊娠期高血压组)进行区分。

在本发明的实施方式中,由于部分不良围产期结局的出现频率较低,如出现死亡结局的患者数仅为8例,因而本发明采用合并结局作为研究的终点,即患者或胎儿一旦出现下列不良围产期结局中的任意一项就认为其发生了终点事件,可进行下一步的分析。针对研究对象的不同,本发明分别提出了患者合并结局及胎儿合并结局,具体的合并结局内容如下所示:

(1)患者合并结局:产后出血、弥散性血管内凝血及患者死亡;

(2)胎儿合并结局:胎儿宫内窘迫、低Apgar评分(5分钟Apgar评分<7分)、低体重儿(<2500g)、胎儿生长发育受限、胎死宫内及新生儿死亡。

在本发明的实施方式中,高危因素的筛选采用单因素和多因素分析结合的方法;

首先,使用患者及胎儿的临床数据,运用单因素逻辑回归,对以上各因素进行初步分析,P值<0.15的被认为具有统计学意义。然后,单因素分析中具有统计学意义的数据进一步进入多因素分析。在多因素分析过程中,使用向前有条件法进一步筛选高危因素。向前有条件法的具体实施过程为:把对合并结局贡献最大并且有统计学意义的自变量逐个依次引入模型,并在引入时考察模型中的其他自变量是否具有统计学意义,若存在没有统计学意义的自变量,则把对合并结局贡献最小并且没有统计学意义的自变量依次逐个从回归模型中剔除,依次循环引入或剔除自变量,直到回归模型中的所有自变量均具有统计学意义,且再引入任一其他自变量却都无统计学意义为止,由此达到筛选出最佳高危因素组合的目的。最终,筛选出最佳高危因素后,进行森林图的绘制,从而更加直观地展现所得出的结果。

为评估患者与胎儿所得高危因素的区分度,需要进行两个步骤的验证:首先,对于患者与胎儿所得的两组高危因素,分别使用ROC曲线判断其区分度,曲线下面积大于0.80,被认为存在良好的区分度。

ROC曲线判断高危因素区分度的具体过程如下:在多因素分析所使用的向前有条件方法中已证明了每个高危因素对合并结局的影响均具有统计学意义,将多因素分析筛选出的患者的多个高危因素作为一组(比如在本发明的一些实施方式中,将筛选出的患者的7个高危因素作为一组),胎儿的多个高危因素作为一组(比如在本发明的一些实施方式中,将筛选出的胎儿的6个高危因素作为一组),分别进行ROC曲线的分析,计算每一组的曲线下面积。若患者及胎儿的高危因素通过计算得出ROC曲线下面积均大于0.80,则可以说明患者及胎儿的高危因素均具有良好区分度,则可进行下一步的内部验证。

然后,在本发明的实施方式中,利用筛选所得的高危因素,采用支持向量机(support vector machine,SVM)、随机森林(random forest,RF)、决策树(decision tree,DT)、k近邻(k-nearest neighbor,KNN)和朴素贝叶斯(

其中,5折交叉验证的具体步骤包括:将AFLP患者信息库中的患者及胎儿随机分为5个相等大小的亚样本组,采用其中的4个亚样本组作为训练组用于训练数据,1个亚样本组作为验证组对数据进行测试;然后将验证组所获得的结果使用机器学习算法包括SVM、RF、DT、KNN和NB获得ROC曲线;5组数据轮流作为验证组进行分析,最终ROC曲线取5组数据的平均值进行绘制,其中,ROC曲线下面积大于0.80,被认为存在良好的区分度。

若通过上述验证过程可获得ROC曲线下面积大于0.80的结果,则说明该部分高危因素的筛选有效。本发明的方法也可用于构建高危因素评分表,对AFLP患者及其胎儿发生不良围产期结局的风险进行量化,从而对其治疗方案进行指导。

在本发明的第二方面,本发明提供了一种预测妊娠期急性脂肪肝母儿不良围产期结局的系统,其包括:

信息获取单元,用于基于入组和出组标准获取患者及胎儿的临床信息构建AFLP患者信息库;入组和出组标准如上文第一方面中所述;

数据处理单元,用于对AFLP患者信息库中的临床信息进行分组,获得危险因素并确认不良围产期结局,并进一步筛选妊娠期急性脂肪肝母儿不良围产期结局高危因素;

鉴别单元,包括数据训练模块和数据验证模块,通过训练模块构建高危因素与不良围产期结局预测模型,并通过数据验证模块验证高危因素对不良围产期结局的预测准确性、敏感度、特异性等。

在本发明的第三方面,本发明提供了一种预测妊娠期急性脂肪肝母儿不良围产期结局的高危因素组合,其包括根据上述第一方面中所述方法或上述第二方面中所述的系统筛选得到的高危因素或其组合;

在本发明的一些实施方式中,所述高危因素组合中包括患者高危因素组合和胎儿高危因素组合,其中,

患者高危因素组合:阴道流血流液(vaginal bleeding/discharge)、产前输注血浆量(PTBD)≤100ml、肌酐(Cr)≥130.5μmol/L、部分凝血活酶时间(APTT)≥45.25s、纤维蛋白原(Fib)≤1.165g/L、血小板(PLT)≤100×10

胎儿高危因素组合:黄疸(Jaundice)、孕周(GA)≤36.1周、尿素氮(BUN)≥6.65mmol/L、谷草转氨酶(AST)≥91U/L、凝血酶原时间(PT)≥19.1s、血清白蛋白(ALB)≤27.55g/L。

上述高危因素或其组合可被记载在便于查看或进行比对的载体上,这类载体可称为预测卡或比对卡,可作为标准方便直接使用和查看。因此,本发明的第四方面,本发明还提供了记载有根据上述第一方面中所述的方法或上述第二方面中所述的系统筛选得到的高危因素或其组合的预测卡或比对卡。

在本发明的第五方面,本发明提供了一种预测妊娠期急性脂肪肝母儿不良围产期结局的方法,其包括根据上述第一方面中所述的方法或上述第二方面所述的系统筛选得到的妊娠期急性脂肪肝母儿不良围产期结局高危因素或其组合或上述第四方面所述的预测卡或比对卡预测妊娠期急性脂肪肝母儿不良围产期结局。

在本发明的第五方面,本发明提供了一种预测妊娠期急性脂肪肝母儿不良围产期结局的装置,其包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器,用于当执行所述计算机程序时,实现如上述第一方面中所述的预测妊娠期急性脂肪肝母儿不良围产期结局的方法。

在本发明的第六方面,本发明提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如上述第一方面中所述的预测妊娠期急性脂肪肝母儿不良围产期结局的方法。

相较于现有技术,本发明的优势在于:

本发明是迄今为止国内外首次对妊娠期急性脂肪肝患者及其胎儿不良围产期结局的高危因素进行研究分析,对妊娠期急性脂肪肝患者及胎儿不良围产期结局的防治及预后的改善具有重要意义。本发明高危因素的筛选和验证过程,以多因素分析为基础,辅以机器学习算法对其结果进行验证。将传统的高危因素筛选方法和机器学习验证方法相结合,可以有效的提高高危因素筛选的准确性及区分度。本发明采用最优约登指数方法用于寻找连续型随机变量的最佳临界点,分组依据明确,在计算过程中简便准确,贴合现有数据特点。本发明同时使用了SVM、RF、DT、KNN和NB这5种机器学习算法,在计算过程中各算法可以互相弥补彼此的不足,进一步的提高验证的准确率,保证所筛选出的高危因素的准确性。本发明的高危因素的筛选和验证过程算法严谨,随着入组病例数的进一步增加,可以进一步提高高危因素对母儿不良围产期结局的预测准确率。本发明研究所得出的母儿高危因素,可以针对所有妊娠期急性脂肪肝患者及其胎儿的不良围产期结局发生情况进行有效预测。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。以下,结合附图来详细说明本发明的实施方案,其中:

图1为高危因素筛选过程示意图;

图2为基于机器学习算法的预测模型的构建及验证过程示意图;

图3为本发明的实施方式中构建的AFLP患者信息库中患者的基本信息情况表;

图4为本发明实施方式中患者(A)与胎儿(B)高危因素的多因素筛选结果及患者(C)与胎儿(D)高危因素的ROC曲线;

图5为本发明实施方式中患者(A)及胎儿(B)机器学习预测模型验证结果图。

具体实施方式

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件或按照制造厂商所建议的条件。

除非另行定义,文中所使用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。本发明所使用的试剂或原料均可通过常规途径购买获得,如无特殊说明,本发明所使用的试剂或原料均按照本领域常规方式使用或者按照产品说明书使用。此外,任何与所记载内容相似或均等的方法及材料皆可应用于本发明方法中。文中所述的较佳实施方法与材料仅作示范之用。

1、根据以下入组和出组标准构建AFLP患者信息库,

患者入组标准:

(1)患者的临床信息符合以下至少三条诊断指标;

a)患者临床信息中显示患者临床表现异常;比如具有恶心、呕吐、黄疸、阴道流血流液、腹痛、头晕、反酸等中的一项或几项;

b)患者临床信息中显示实验室检查指标异常;比如具有以下列出的异常指标中的一项或几项:肝功异常,如转氨酶、总胆红素升高以及白蛋白下降等;肾功受损,如肌酐、尿素氮、碱性磷酸酶升高等;凝血功能障碍,如凝血酶原时间、部分凝血活酶时间延长以及纤维蛋白原水平下降等;血常规异常,如血红蛋白、血小板减少及白细胞升高等;

c)患者临床信息中存在并发症信息;比如具有肝功能损伤、肾功能衰竭、凝血功能障碍等中的一项或几项;

d)患者临床信息中存在辅助检查信息提示患者肝脏异常;比如肝脏活检、B超或计算机断层扫描等检查提示具有肝脏脂肪变或肝细胞小泡性脂肪变性等;

(2)患者在本中心完成分娩或具有确切的胎儿预后;

患者出组标准:

(1)患者的临床信息提示其同时患有病毒性肝炎和/或其他肝脏疾病;

(2)患者的临床信息提示其同时患有恶性肿瘤等恶性疾病;

最终AFLP患者信息库中的患者入组人数:146例,相应的胎儿入组人数:172例,包括:124例单胎、19例双胎、2例三胎及1例四胎,患者及胎儿基本信息情况表如图3所示。

2、临床资料的分组:将AFLP患者信息库中的临床资料,按照连续型随机变量以及离散型随机变量分别进行分组,并以此作为筛选高危因素的基础。

对连续型随机变量,比如患者的年龄、分娩孕周、谷丙转氨酶数值、血红蛋白数值等,采取受试者工作特征曲线(receiver operating characteristic curve,ROC)最优约登指数(Youden Index,YI)的方法寻找最佳临界点。约登指数=敏感度+特异度-1,选取约登指数最高值所对应的连续型随机变量值作为最佳临界点,并利用该最佳临界点将连续型随机变量进行二分类分组,分组以0或1进行标记,具体分组方式如下表1(A-B)所示;

表1A

表1B

对于离散型随机变量,比如患者的分娩方式、胎儿数、临床表现、妊娠合并症等,均作为分组数据处理,即通过患者所属不同类别将患者区分为≥2组,进而针对各组以0或1或2等进行标记,具体分组方式如下表2所示。

表2

3、患者及胎儿结局的确定:

由于部分不良围产期结局的出现频率过低,可能会对最终高危因素筛选的准确性产生影响,因而AFLP患者及胎儿确定均采用合并结局作为终点事件,即患者或胎儿出现以下合并结局中的任意一项就认为其达到了研究的终点。针对患者及胎儿数据的差异,分别为这两组人群制定了相适合的合并结局:

(1)患者合并结局:产后出血、弥散性血管内凝血及患者死亡;

(2)胎儿合并结局:胎儿宫内窘迫、低Apgar评分(5分钟Apgar评分<7分)、低体重儿(<2500g)、胎儿生长发育受限、胎死宫内及新生儿死亡。

4、按照图1示意进行高危因素筛选:首先,使用患者及胎儿的临床数据,运用单因素逻辑回归,对以上各因素进行分析,P值<0.15的被认为具有统计学意义。针对患者的合并结局,以下因素在单因素分析中被认为具有统计学意义:分娩方式、既往剖宫产史、黄疸、阴道流血流液、谷丙转氨酶、谷草转氨酶、白细胞、总胆红素、血红蛋白、血小板、纤维蛋白原、凝血酶原时间、部分凝血活酶时间、肌酐、尿素氮、血清白蛋白、碱性磷酸酶、产前输注血浆量及产时输注血浆量;针对胎儿的合并结局,以下因素在单因素分析中被认为具有统计学意义:母亲分娩年龄、母亲分娩孕周、恶心、呕吐、黄疸、谷丙转氨酶、谷草转氨酶、白细胞、总胆红素、血小板、纤维蛋白原、凝血酶原时间、部分凝血活酶时间、肌酐、尿素氮、血清白蛋白、碱性磷酸酶、产时输注冷沉淀量及产时输注血浆量。

然后,以上单因素分析中具有统计学意义的数据进一步进入多因素分析。在多因素分析过程中,使用向前有条件法进一步筛选高危因素。向前有条件法的具体实施过程为:把对合并结局贡献最大并且有统计学意义的自变量逐个依次引入模型,并在引入时考察模型中的其他自变量是否具有统计学意义,若存在没有统计学意义的自变量,则把对合并结局贡献最小并且没有统计学意义的自变量依次逐个从回归模型中剔除,依次循环引入或剔除自变量,直到回归模型中的所有自变量均具有统计学意义,且再引入任一其他自变量却都无统计学意义为止,由此达到筛选出最佳高危因素组合的目的。最终,筛选出最佳高危因素后,进行森林图的绘制,从而更加直观地展现所得出的结果。

为评估患者与胎儿所得高危因素的区分度,需要进行两个步骤的验证:首先,对于患者与胎儿所得的两组高危因素,分别使用ROC曲线判断其区分度,曲线下面积大于0.80,被认为存在良好的区分度。ROC曲线判断高危因素区分度的具体过程如下:在多因素分析所使用的向前有条件方法中已证明了每个高危因素对合并结局的影响均具有统计学意义,将多因素分析筛选出的患者的7个高危因素作为一组,胎儿的6个高危因素作为一组,分别进行ROC曲线的分析,计算每一组的曲线下面积。若患者及胎儿的高危因素通过计算得出ROC曲线下面积均大于0.80,则可以说明患者及胎儿的高危因素均具有良好区分度。患者及胎儿多因素筛选结果及ROC曲线如图4所示。

筛选得到的高危因素包括患者高危因素和胎儿高危因素:

患者高危因素筛选具体因素:阴道流血流液(vaginal bleeding/discharge)、产前输注血浆量(PTBD)≤100ml、肌酐(Cr)≥130.5μmol/L、部分凝血活酶时间(APTT)≥45.25s、纤维蛋白原(Fib)≤1.165g/L、血小板(PLT)≤100×10

胎儿高危因素筛选具体因素:黄疸(Jaundice)、孕周(GA)≤36.1周、尿素氮(BUN)≥6.65mmol/L、谷草转氨酶(AST)≥91U/L、凝血酶原时间(PT)≥19.1s、血清白蛋白(ALB)≤27.55g/L。

ROC曲线下面积包括患者ROC曲线下面积及胎儿ROC曲线下面积:

患者ROC曲线下面积为0.936,95%置信区间(confidence interval,CI)为0.89-0.98,P<0.001;

胎儿ROC曲线下面积为0.888,95%CI为0.84-0.94,P<0.001。

根据以上结果可知,通过ROC曲线可以初步证明所筛选出的患者及胎儿的高危因素具有较好的区分度。

5、为进一步验证筛选出的患者及胎儿高危因素的区分度,采用机器学习的方法对这两部分因素分别进行验证。按照图2示意构建高危因素与不良围产期结局预测模型并进行验证,利用上述过程中所得的高危因素,采用广泛使用的5种机器学习算法:采用SVM、RF、DT、KNN和NB,采用5折交叉验证的方法对高危因素的区分度进行验证。5折交叉验证的具体步骤为:将研究中的所有患者及胎儿随机分为5个相等大小的亚样本组,采用其中的4个亚样本组作为训练组用于训练数据,最后1个亚样本组作为验证组对数据进行测试。然后将验证组所获得的结果使用上述5种机器学习算法获得ROC曲线。这5组数据轮流作为验证组进行分析,最终ROC曲线取这5组数据的平均值进行绘制。ROC曲线下面积大于0.80,被认为存在良好的区分度。患者及胎儿机器学习预测模型验证结果如图5所示。

同样,若通过上述验证过程获得的ROC曲线下面积大于0.80,说明上述部分筛选得到的高危因素有效。

图5中可以看到,患者高危因素通过SVM得出的ROC曲线下面积为0.90±0.06,KNN得出的ROC曲线下面积为0.89±0.05,NB得出的ROC曲线下面积为0.93±0.06,DT得出的ROC曲线下面积为0.90±0.07,RF得出的ROC曲线下面积为0.91±0.06;

胎儿高危因素通过SVM得出的ROC曲线下面积为0.87±0.05,KNN得出的ROC曲线下面积为0.86±0.04,NB得出的ROC曲线下面积为0.86±0.04,DT得出的ROC曲线下面积为0.83±0.03,RF得出的ROC曲线下面积为0.87±0.05;

以上内部验证结果进一步说明,患者及胎儿高危因素均具有良好的区分度,能够较为准确的预测妊娠期急性脂肪肝母儿不良围产期结局。

妊娠期急性脂肪肝为罕见的产科急症,本发明搜集了146例患者进行研究,为目前已知的最大的单中心研究,具有极高的准确性及可信性。通过同时采用受试者工作特征曲线及机器学习的方法对患者及胎儿的高危因素进行内部验证,最终结果的曲线下面积均已超过0.80,可以在很大程度上说明这两部分高危因素的区分度。进一步,本发明对已获得的患者及胎儿的高危因素进行外部验证,从而更加能够说明该部分成果具有较高的可行性及广泛的适用性。进行外部验证的具体实施办法为:在多个可完整持续获取临床信息的权威医疗中心进行数据搜集,初步决定纳入200例患者对筛选出的患者及胎儿的高危因素进行外部验证,验证方法可采用SVM、RF、DT、KNN和NB等广泛应用的机器学习算法,采用5折交叉验证或10折交叉验证方法进行区分度的确定,验证结果的ROC曲线下面积可达0.85,预计随纳入患者人数的增多,验证结果的ROC曲线下面积可达0.90以上。在外部验证完成后,可绘制高危因素列线表,完整形成预测妊娠期急性脂肪肝母儿不良围产期结局的预测卡。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号