首页> 中文期刊> 《中华外科杂志》 >机器学习算法在早期肝细胞癌术后复发预测中的应用价值

机器学习算法在早期肝细胞癌术后复发预测中的应用价值

         

摘要

目的比较多种机器学习算法在早期肝细胞癌(HCC)术后复发预测中的效能。方法回顾性分析2009年5月至2019年12月南京医科大学第一附属医院收治的882例接受根治性手术切除的早期HCC患者的临床资料,其中男性701例,女性181例,年龄(57.3±10.5)岁(范围:21~86岁)。将患者按2∶1随机分为训练集(588例)和测试集(294例)。构建的机器学习预测模型包括随机生存森林(RSF)、梯度提升机、弹性网络-Cox回归和Cox回归模型。采用一致性指数(C-index)衡量模型预测的准确性、综合Brier分数量化模型的预测误差、校准曲线反映模型的拟合情况。比较机器学习模型、竞争模型和HCC分期系统的预测效能。所有模型均在独立的测试集内进行验证。结果训练集内患者中位无复发生存时间为61.7个月,测试集内患者中位无复发生存时间为61.9个月,两组患者无复发生存情况的差异无统计学意义(χ2=0.029,P=0.865)。RSF模型由5个常用临床病理学特征构成:白蛋白-胆红素分级、血清甲胎蛋白、肿瘤数目、肝切除方式和微血管侵犯。在训练集和测试集中,RSF模型的C-index值分别为0.758(95%CI:0.725~0.791)和0.749(95%CI:0.700~0.797),综合Brier分数分别为0.171和0.151。RSF模型对早期HCC复发预测的准确性优于其他3种机器学习模型、竞争模型(ERASL模型)及HCC分期系统(巴塞罗那分期、中国肝癌的分期方案、TNM分期),差异均有统计学意义(P值均&0.01)。校准曲线提示,RSF模型的预测概率与实际观察值具有较好的一致性。RSF模型可将早期HCC患者的复发风险分为低危、中危和高危组,在训练集和测试集内三组患者无复发生存情况的差异有统计学意义(P&0.01)。RSF模型对早期HCC术后复发风险的分层明显优于TNM分期。结论本研究构建的RSF模型集合了5个常用临床病理学特征,可较为准确地预测复发风险。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号