首页> 中文学位 >河南省儿童白血病发病风险预测模型的建立
【6h】

河南省儿童白血病发病风险预测模型的建立

代理获取

目录

声明

摘要

图和附表清单

中英文缩略词对照表

引言

第一部分 指标体系的建立

1 对象与方法

1.1 研究对象

1.2 问卷调查

1.3 指标体系的建立

1.4 统计学处理

1.5 质量控制

2 结果

2.1 研究对象的基本人口学特征比较

2.2 单因素Logistic回归分析

2.3 多因素Logistic回归分析及PARP值的计算

3 讨论

3.1 与儿童白血病发病相关联的因素

3.2 儿童白血病发病风险预测模型的指标体系

第二部分 预测模型的建立与验证

1 对象与方法

1.1 研究对象

1.2 研究方法

1.3 统计学处理

2 结果

2.1 研究对象的基本人口学特征比较

2.2 预测模型的建立

2.3 预测模型的验证与评价

3 讨论

3.1 人工神经网络模型和Logistic回归模型

3.2 创新性和局限性

结论

参考文献

综述 基于高危人群筛选的疾病风险预测模型的研究和应用现状

个人简历、在校期间发表的学术论文与研究成果

致谢

展开▼

摘要

儿童白血病已成为危害儿童生命的主要疾病,它不仅对儿童的健康造成威胁,同时也给社会和家庭带来了经济负担和精神压力。但儿童白血病也是可防可治的,它在规范治疗后比成人白血病更容易缓解;故采用适当的筛查工具,对高危儿童进行筛查、预防监测,做到对白血病患儿的早发现、早诊断、早治疗,具有十分重要的公共卫生意义。国内外已建立了多个癌种的疾病风险预测模型,但尚没有关于儿童白血病的;指标体系的建立是构建儿童白血病预测模型的关键之一,而对于白血病儿童这个特殊的人群,疾病的发生不仅与患儿的有害环境暴露相关,还与其父母亲产前、哺乳期的有害环境暴露有关;另外,各个区域的致病因素也不尽相同,各有其特点。
  目的:
  本研究旨在环境危险因素流行病学分析的基础上,筛选适当的预测因素建立预测模型的指标体系,而后建立河南省儿童白血病发病风险预测模型并进行验证,为该省儿童白血病高危人群的筛选、疾病的预测及一级预防策略的制定提供支持。
  方法:
  1.根据病例对照的研究设计,于2014-2016和2017-2018年分两阶段在河南省4家医院募集住院在治的、经骨髓组织病理学确诊的白血病患儿为病例;同时,按1∶1比例于病例所在同家医院的呼吸病区、消化病区及中医康复病区,募集非白血病患儿作为对照。以面对面访谈患儿父母或其他监护人的形式完成统一的调查问卷,问卷内容包含研究对象及其父、母亲的一般人口学资料、潜在疾病影响因素暴露情况等。
  2.利用前阶段收集的病例-对照数据,用非条件Logistic回归等方法对各指标作危险因素分析,计算人群归因危险度百分比(Population Attributable Risk Percent,PARP)。根据OR值(Odds Ratio)及其95%置信区间、PARP等结果,结合文献学习及咨询专家意见建立本次模型的指标体系。
  3.合并前、后两阶段募集的样本数据,按照3∶1的比例将样本随机分为建模人群和验证人群,分别运用人工神经网络(Artificial Neural Network,ANN)和Logistic回归两种方法建立预测模型;在验证人群中进行模型的验证,从区分度和校准度两方面评价模型的预测效果。
  4.统计学处理采用IBM SPSS Statistics21.0和R3.3.3软件。
  结果:
  1.样本募集:第一阶段募集符合标准、问卷合格的病例407例,对照407例;第二阶段募集病例120例,对照120例,合并所得样本共得病例527例、对照527例,按3∶1的比例将对象随机分为建模人群790例和验证人群264例。
  2.预测模型指标体系的建立:根据各指标OR值、PARP的结果,结合文献学习及专家意见,最终确定15个指标作为模型的输入变量,分别为:儿童相关因素(X1出生体质量、X2娩出方式、X3家庭月收入水平、X4住宅周围空气污染史、X5居住环境低频电磁场暴露史、X6感冒发烧史、X7肿瘤家族史、X8农药杀虫剂接触史、X9居室经常通风换气、X10经常食用不健康食品史),母亲相关因素(X11经常体育锻炼、X12常规服用叶酸、X13房屋装修史、X14农药杀虫剂接触史)及父亲相关因素(X15染发史)。
  3.预测模型的建立与验证:在建模过程中,ANN模型在逐渐纳入预测指标X~X15后,结果显示隐含层节点数为2时,交叉验证的均方根误差最小(0.4127),受试者工作特征曲线下面积(AUC)值最大(0.864),模型的最佳临界点为0.3365,灵敏度为89.9%,特异度为61.9%,拟合优度检验P=0.773(P>0.05认为模型拟合了数据,即模型的校准度较好);Logistic回归结果显示共有11个指标纳入方程,预测模型为:P=1/(1+exp[-(1.151+1.313X8+1.214X6+1.073X15+0.953X4+0.941X7+0.837X13+0.835X5+0.722X14+0.632X10-0.683X3-0.734X12)]),模型的AUC为0.842,最佳临界点为0.3252,灵敏度为89.6%,特异度为55.9%,拟合优度检验P=0.361。预测模型经验证,结果显示,ANN模型的AUC(0.878)、灵敏度(89.3%)、特异度(79.6%)及约登指数(0.648)均优于Logistic回归模型的AUC(0.847),灵敏度(85.2%),特异度(58.5%)及约登指数(0.478),且AUC的差异具有统计学意义(P=0.042),即ANN模型的区分度优于Logistic回归模型;经拟合优度检验,ANN模型的校准度(P=0.572)优于Logistic回归模型(P=0.359)。
  结论:
  采用ANN和Logistic回归两种方法建立儿童白血病发病风险的预测模型,ANN模型的预测效能优于Logistic回归模型。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号