首页> 中文学位 >体外冲击波治疗上尿路结石的疗效预测:人工神经网络和Logistic回归模型的建立与比较
【6h】

体外冲击波治疗上尿路结石的疗效预测:人工神经网络和Logistic回归模型的建立与比较

代理获取

目录

摘要

前言

0.1 研究背景

0.2 研究内容

参考文献

第一章 Logistic回归模型和人工神经网络的原理与方法

1.1 Logistic回归模型原理

1.2 人工神经网络原理

1.3 Logsitic回归模型和人工神经网络的SPSS实现

参考文献

第二章 肾结石ESWL疗效的Logistic回归和人工神经网络预测模型

2.1 临床资料与方法

2.2 结果

2.3 讨论

参考文献

第三章 ESWL治疗输尿管结石疗效的logistic回归和人工神经网络预测模型

3.1 临床资料与方法

3.2 结果

3.3 讨论

参考文献

第四章 Logistic回归模型与人工神经网络的比较

4.1 原理与方法的比较

4.2 预测效果的比较

4.3 两种模型优缺点的比较

4.4 结论

参考文献

第五章 本研究的不足之处和未来的研究方向

5.1 不足之处

5.2 未来的研究方向

参考文献

第六章 ESWL治疗上尿路结石疗效的预测模型系统性文献综述

6.1 影响ESWL导致上尿路结石粉碎的因素

6.2 影响上尿路结石排出的因素

6.3 预测方法

参考文献

中英文缩略词表

致谢

博士研究生期间发表论文情况

声明

统计学审稿证明

展开▼

摘要

研究背景和目的:
   泌尿系结石是泌尿外科的常见病与多发病,尤其在我国南方的部分省份,发病率较高。随着人们生活水平的提高,近年来上尿路结石的发病率明显增高。自上个世纪80年代问世以来,体外冲击波碎石(Extracorporeal Shockwave Lithotripsy,ESWL)经过三十年的技术改进和临床经验积累,使得很大一部分的上尿路结石患者免除开刀之苦,其治疗上尿路结石具有安全、有效、痛苦小、恢复快和费用不高的特点。然而,对于较大上尿路结石的治疗,可能需要多次碎石,一方面,可能增加肾脏不可逆损伤的风险;另一方面,排石过程中经常会伴随肾绞痛、发热、血尿、石街等并发症,从而不得不转为其它外科方法治疗,影响ESWL的疗效。临床实践证明,并不是所有的上尿路结石都适合ESWL治疗,有些结石ESWL无法击碎,有些结石ESWL击碎后病人无法自行排出。伴随ESWL不成功而带来的问题是,病人可能会为失败的ESWL承担经济、时间及痛苦就医经历的后果,从而使得ESWL的优势不能最大化。如果在体外冲击波碎石前,能对其治疗效果准确预测,一方面可以制定相对正确的治疗方案,避免减少病人不必要的痛苦和经济损失、降低医疗服务成本;另一方面也有利于在治疗前向病人充分告知,有利于医患的沟通和理解。
   尽管对于ESWL治疗上尿路结石疗效预测的研究不少,然而,因受限于研究条件,存在以下不足:1)个别病例数较少,仅局限在方法学上的探索,并未广泛应用在临床实践中;2)受研究条件等限制,纳入的疗效影响因素不全面,因此预测的准确性还有待提高;3)部分研究对病例没有分层,将肾结石与输尿管结石合并在一起研究,临床应用意义不大。本研究分别运用logistic回归分析和人工神经网络建立ESWL治疗肾结石和输尿管结石的疗效预测模型,确定ESWL治疗上尿路结石疗效的重要影响因素和预测变量重要性评价,并对人工神经网络和Logistic回归分析方法、预测效果和优缺点进行比较,最后,确定预测效果较好的模型的工作概率分界值,使研究成果直接转化为临床应用。
   方法:
   对325例肾结石患者和1,065例输尿管结石ESWL治疗前的临床资料如性别、尿路刺激症、治疗前血尿、肾绞痛、结石位置、结石患侧、年龄、身高、体重、病程时间、结石长径、结石宽径等影响因素和ESWL治疗结局进行回顾性分析。
   首先,将ESWL治疗的肾结石和输尿管结石的病例资料分别进行无偏随机化分组,对于Logistic回归分析和建模,约70%的病例分配至训练样本,约30%病例分配至坚持样本;而对于人工神经网络,则是约56%的病例分配至训练样本,约14%的病例分配至检验样本,约30%的病例分配至坚持样本。
   采用x2检验对分类变量如性别、尿路刺激症、治疗前血尿、肾绞痛、结石位置、结石患侧等进行每个预测变量与应变量(ESWL治疗结局)关系的显著性检验。通过拟合单变量logistic回归取得连续预测变量(年龄、体重指数、病程时间、结石长径与短径的乘积)的显著性检验,初步找出对应变量(ESWL治疗结局)有影响的因素,再将上述预测变量显著性检验分析中P<0.25者,与其它重要预测变量一起,纳入多元模型的候选预测变量。然后采用logistic逐步回归分析(前向法:LR法)多因素分析,建立logistic回归预测模型,并将训练样本组和坚持样本组回代至此模型,得到ESWL治疗结局预测概率,绘制ROC曲线,计算曲线下面积(AUC),并计算敏感度,特异度和总准确度,评价预测模型的准确性。
   建立3层前向型神经网络模型,隐含层设置为1层,输入层的参数为所有10项可能有临床意义的预测指标,预测因子设置依次为性别、尿路刺激症、治疗前血尿、肾绞痛、结石位置、结石患侧,预测协变量依次为年龄、体重指数、病程时间、结石长径与结石宽径的乘积(文中简称“结石大小”),标准化协变量。其中,性别编码为“男”=1、“女”=2;尿路刺激症、治疗前血尿、肾绞痛编码为“有”=1、“无”=2;结石位置编码为“肾上盏”=1、“中盏”=2、“下盏”=3、“肾盂”=4、“混合”=5或“输尿管上段”=1、“中段”=2,“下段”=3。输出层为ESWL治疗结局,“成功”编码为1,“失败”编码为0。以前述“分区变量”分配病例样本,选择“自动体系结构选择”,隐含层中最小单位数为1,最大单位数为50,训练类型为“批处理”(肾结石组)或“袖珍批处理”(输尿管结石组),优化算法选用“调整的共轭梯度”(肾结石组)或“梯度下降”(输尿管结石组),间隔中心点为0,间隔偏移量为±0.5。运行神经网络后,获得ESWL治疗结局预测的拟概率,以0.50为预测分界值,计算预测的总准确率、灵敏度和特异度,绘制ROC(Receiver Operating Characteristiccurve,ROC)曲线,计算曲线下面积(Area Under Curve,AUC),评价人工神经网络预测的准确性。
   最后,从建模原理与方法、预测效果、优缺点三方面比较logistic回归预测模型和人工神经网络。
   统计学软件包
   应用IBM(@)公司出品的统计软件包SPSS20.0进行x2检验,单变量Logistic回归和多元logistic分析和建立模型,并以其附带的神经网络模块中的多层感知器建立人工神经网络。采用Hosmer-Lemeshow进行logistic回归拟合优度检验,并以x2检验进行模型的显著性检验。P值精确到小数点后3位,以P<0.05为有统计学差异。
   用统计软件包Medcalc(@)进行ROC曲线的绘制和ROC曲线下面积的比较,进行约登指数的计算和预测概率分界值的筛选。
   结果:
   1)ESWL治疗肾结石组
   共325例肾结石,最长随访3个月,碎石成功250例,转为其它方法治疗75例,总成功率76.9%。对全部肾结石患者性别、结石患侧、结石位置、尿路刺激症状、血尿或肾绞痛进行单因素分析,我们发现结石患侧、结石位置、尿路刺激症状、血尿对ESWL治疗结局有显著性影响。对本组患者年龄、体重指数、病程时间、结石大小进行单因素logistic回归拟合,结果排除体重指数,其余预测因素均纳入候选变量。
   进一步用logistic逐步回归进行多因素分析,发现病程时间、血尿和结石大小,是ESWL治疗肾结石疗效的独立影响因素(P<0.05),其AOR(Adjusted Odds Ratio)值(95%可信区间)依次是0.977(0.964-0.989)、12.388(3.443-44.565)、0.192(0.113-0.323)。
   建立以训练样本为基础的logistsic预测模型。对预测模型进行x2检验验证其显著性,x2值为108.938,P<0.001,预测变量对应变量(ESWL碎石结局)有显著的解释能力。通过分类交互表计算Hosmer-Lemeshow拟合优度检验统计量,得到x2=6.927,df=8,P=0.545,无统计学显著性差异,因此认为模型拟合观测数据良好。通过预测-观察分类表,对于模型预测的准确性进行评价。将训练样本和坚持样本的观察数据分别回代到模型,得到模型对训练样本和坚持样本的预测概率值,以0.5作为预测结果的分界值,结果显示模型对训练样本的灵敏度为94.4%,特异度63.3%,总体准确率为86.0%,而对坚持样本的灵敏度100%,特异度20.0%,总体准确率为88.4%。
   人工神经网络自动剔除建模过程中典型的“冗余”单元后,输入层共建立19个单元。自动体系结构选择了建立一个隐含层,隐含层内共有6个单元,激活函数为hyperbolictangent,输出层共有2个单元,激活函数为softmax。将预测变量重要性指标除以最大指标值,得到标准化的预测变量重要性排序,发现列于前五位的是:结石大小、病程时间、血尿、结石位置、体重指数。以0.5作为预测拟概率分界值,运用人工神经网络对全部样本进行预测,结果显示训练样本的敏感度、特异度和总体准确率为98.4%、72.5%和90.8%;检验样本的敏感度、特异度和总体准确率为97.4%、55.6%和89.6%;坚持样本的敏感度、特异度和总体准确率为93.3%、46.7%和86.5%。
   Logistic回归模型的AUC为0.625,95%可信区间为0.525-0.718;人工神经网络AUC为0.856,95%可信区间为0.774-0.917,与AUC为0.5进行显著性检验,前者P值为0.122,后者为P<0.001。两者AUC差异的非参数显著性检验,z值为3.988,P=0.0001,两者AUC存在统计学上显著性差异,意味着logistic回归模型的预测效果差,ANN的预测效果优于logistic回归模型。
   计算约登指数并权衡敏感度与特异度后,发现概率分界值为0.595时,肾结石ESWL疗效预测的ANN模型的敏感度和特异度达到较为理想状态,分别为92%和60%。
   2)ESWL治疗输尿管结石组
   共纳入1065例输尿管结石,最长随访3个月,碎石成功874例,转为其它方法治疗191例,总成功率82.1%。用x2检验对本组患者性别、结石患侧、结石位置、尿路刺激症状、血尿或肾绞痛进行单因素分析,按着P<0.25的预测变量筛选标准,我们发现除治疗前是否出现血尿外,其余预测因素对ESWL治疗结局有显著性影响。对本组患者年龄、体重指数、病程时间、结石大小进行单因素logistic回归逐一拟合,均纳入候选预测变量。
   用logistic回归对进行多因素分析,结果显示治疗前肾绞痛、结石位置(输尿管上段、输尿管中段)结石大小为ESWL治疗输尿管结石疗效的独立影响因素,其AOR值(95%可信区间)分别是1.508(0.999-2.277)、0.651(0.391-1.086)、0.374(0.191-0.731)、0.246(0.152-0.396)。Logistic回归预测模型的x2值为54.460,P值<0.001,提示纳入模型的预测变量对治疗结局有显著的解释能力。预测模型的拟合优度通过Hosmer-Lemeshow检验,显示模型拟合程度尚好(x2=8.406,df=8,P=0.395)。将训练样本和坚持样本分别回代至预测模型,得到对训练样本和坚持样本进行预测概率值,以0.5作为预测概率分界值,结果显示训练样本灵敏度98.1%,特异度4.2%,总体准确率为82.9%。坚持样本灵敏度99.3%,特异度11.3%,总体准确率为84.7%。
   人工神经网络自动剔除建模过程中典型的“冗余”单元后,输入层共建立17个单元。自动体系结构选择了建立一个隐含层,隐含层内共有5个单元,激活函数为hyperbolictangent,输出层共有2个单元,激活函数为softmax。将预测变量重要性指标除以最大指标值,得到标准化的预测变量重要性排序,结石大小、结石位置、病程时间、年龄和体重指数列于前五位。
   应用人工神经网络对全部样本进行预测,以0.5作为预测拟概率分界值,结果显示训练样本的敏感度、特异度和总体准确率分别为98.8%,12.7%和84.0%;检验样本的敏感度、特异度和总体准确率分别为99.2%,16.7%和89.3%;坚持样本的敏感度、特异度和总体准确率分别为97.8%,9.4%和83.2%。
   Logistic回归模型的AUC为0.729,人工神经网络的AUC为0.751,与AUC为0.5进行显著性检验,前者P值<0.001,95%可信区间为0.676-0.777,后者为P值<0.001,95%可信区间为0.700-0.797,借助统计软件包MedCalc(@)对AUC进行非参数显著性检验,计算z统计量为0.750,对应的P值为0.4534,即两种预测模型的AUC面积在统计学上无显著性差异,换言之,输尿管结石ESWL疗效的logistic回归模型和ANN模型的预测效果相差不大。权衡敏感度与特异度后,确定概率分界值为0.769时,ESWL治疗肾结石疗效预测的ANN模型的敏感度和特异度达到较为理想状态,分别为81%和60%。
   结论:
   本研究发现,患者病程时间、结石大小、治疗前血尿是影响肾结石ESWL疗效的独立影响因素,而影响输尿管结石的ESWL疗效的重要因素为性别、肾绞痛、结石位置和结石大小。和Logistic逐步回归法建立的预测模型相比较,人工神经网络具有自学习、并行计算的功能,虽对预测变量的解释性不如logistic回归模型,但预测效果较好,仍可做为预测ESWL成功率的有利工具,有助于筛选更加适用ESWL治疗的患者,有利于患者充分知情,与患者共同制定治疗方案,减轻患者医疗风险和经济负担。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号