首页> 中文学位 >基于两种模型的绝经后骨质疏松性骨折风险预测工具构建研究
【6h】

基于两种模型的绝经后骨质疏松性骨折风险预测工具构建研究

代理获取

目录

声明

摘要

第一部分文献综述

综述一骨质疏松性骨折危险因素

综述二骨质疏松性骨折诊断方法与风险预测工具

第二部分基于两种模型的绝经后骨质疏松性骨折风险预测工具构建研究

1.前言

2.资料与方法

2.1流行病学调查

2.2变量筛选和模型构建

3.技术路线

4.结果

4.1调查完成情况

4.2研究人群一般信息

4.3 SMOTE算法平衡数据

4.4绝经后骨质疏松性骨折影响因素筛选

4.5绝经后骨质疏松性骨折预测模型构建

4.6两种模型的预测效能比较

5.讨论

5.1绝经后骨质疏松性骨折危险因素

5.2绝经后骨质疏松性骨折中医证候

5.3结合危险因素及中医证候开展骨折早期预防

5.4 Logistic回归模型与决策树分类模型比较

5.5构建疾病风险预测模型思路

5.6不足与展望

5.7创新点

6.结论

参考文献

致谢

个人简历

附件

展开▼

摘要

绝经后骨质疏松性骨折是老年常见疾病,是绝经后骨质疏松症(PMOP)的临床终点结局。该病因人体雌激素缺乏,进而导致骨量减少及骨组织结构变化,使骨脆性增加,最终导致骨折。由此引起的疼痛、骨骼变形等并发症,严重影响老年患者生活质量与寿命。相关研究提示,绝经后女性罹患骨质疏松症的概率为男性4倍。
  现代临床和基础研究表明,多种常见危险因素,如年龄、骨折史、饮食习惯、骨密度值等共同作用下,可加速PMOP骨折的发生发展。中医古籍文献中虽没有“绝经后骨质疏松性骨折”病名的明确记载,但该病相关影响因素散见于历代典籍。《素问·上古天真论》云:“女子七七任脉虚,太冲脉衰少,天癸竭,地道不通……”。可见,围绝经期女性体内激素水平、免疫调节能力下降,往往出现气血虚弱、月经断绝等症状,这些极具中医理论特色和内涵的临床症状可能对PMOP患者发生骨折具有一定早期预警作用。
  目前,国内骨质疏松性骨折流行病学数据较之于国外偏少。国际公认并推荐的骨折预测工具多是基于其他种族和地域,以及其他国家和地区人口饮食习惯、社会文化而构建,将其推广运用于我国人群的骨质疏松性骨折风险预测存在一定局限性。故基于国内社区人群,开展绝经后骨质疏松性骨折高危人群流行病学资料调查,筛选现代医学危险因素和具有中医特色的临床症状并凝练中医证候,构建符合我国人口学特征的PMOP骨折风险预警工具十分必要。
  研究目的:
  1.明确与PMOP骨折发生密切相关的现代医学危险因素和中医证候。
  2.建立兼具准确性和实用性的PMOP骨折风险预测工具。
  3.探索构建PMOP骨折风险预测模型的方法学机制。
  研究内容:
  1.预警指标筛选
  Group Lasso回归可以同时选择分类协变量(包括二分类变量与有序分类变量)、连续型协变量,在保证预测精度的前提下同时进行参数估计和变量选择,显著降低预测的错误率,在疾病早期风险评估工具变量筛选中具有独特优势。运用Group Lasso回归筛选“PMOP→骨折”密切相关的现代医学危险因素和中医症状、证候,并结合临床经验,最终确定“PMOP→骨折”的预警指标。
  2.早期预测模型构建
  决策树是机器学习分类算法的代表之一,其可从一组无规则事例中提取出分类规则,按照自上而下的递归方式,在每个内部节点比较其属性值大小并判断该节点以下的分支,在叶子节点得到分类结论。Logistic回归分析是一种广义的线性回归分析模型,可用于筛选疾病发生的危险因素,并根据危险因素预测疾病发生概率。以筛选出的早期预警指标作为协变量,以骨折发生情况(是否骨折)为结局变量,分别基于决策树分类模型和Logistic回归模型构建PMOP骨折早期预测工具。
  3.早期预警工具形成及构建机制
  运用接收者工作特征曲线(ROC),根据ROC曲线下面积,分别比较决策树模型和Logistic回归构建的两种PMOP骨折早期预测模型准确性,经对比分析后形成兼具准确性、实用性的PMOP骨折风险预测工具,经进一步梳理和总结,凝练疾病风险早期评估模型的构建机制。
  研究方法:
  1.研究设计类型
  注册登记式调查研究。
  2.问卷调查
  对《社区40岁~65岁妇女骨质疏松危险因素及证候调查问卷》进行完善并修订,使其具有较好的信度与效度。问卷主要内容包括:人群基本特征、生活习惯、危险因素、临床症状、骨密度检测值等5个方面内容。
  分别于2009年3月~6月、2010年3月~8月、2011年6月~11月期间,采用现场调查方式,获取包括:一般信息、危险因素、临床症状、骨折与否、骨折时间、骨折次数、骨折原因、骨折部位等在内的人群特征信息。
  3.研究人群
  分别在北京市东城区和上海市徐汇区,登记社区40-65岁PMOP骨折高危患者的相关临床及生活习惯等信息。同时排除继发性骨质疏松症患者。
  4.统计软件
  基于Microsoft Excel构建数据库,采刖SPSS23.0对患者一般情况进行描述分析。运用R3.3.3软件的决策树包、gglasso包构建基于SMOTE过抽样数据的决策树分类模型和Logistic回归模型。并通过ROC曲线下面积进行模型预测效能的评价。
  研究结果:
  1.完成情况
  在上海、北京两地连续三年进行了3次调查,发出问卷1823份,数据完整者1498份,应答率为82.17%,失访或者数据不全占17.83%。
  2.一般描述
  被调查的1498人中,绝经人群共1129人,其中49人发生了PMOP骨折,骨折发生率约为4.34%。根据研究人群骨密度检测结果和骨折发生原因分析,扭伤12例,跌倒37例;骨折部位方面,桡骨远端的骨折14例,股骨上端骨折7例,胸腰椎椎体骨折6例,踝关节骨折22例。
  3.影响因素筛选
  以是否发生骨折作为结局变量,经Group Lasso模型筛选得出,具体组变量包括:骨密度、年龄、食物类、身高、月经情况、孕产次数和肝肾阴虚(手足烦热、盗汗、腿软、目眩、视物模糊、目睛干涩、恶热、脱发、齿摇、口苦、易怒、午后潮热、失眠、多梦易惊、胸胁苦满、下肢转筋)。决策树模型共筛选得到6个解释变量,各指标按重要程度从大到小依次为骨密度、目眩、肉类、分娩次数、视物模糊和乏力。
  4.预测模型构建
  4.1 基于Logistic回归的模型构建
  根据Group Lasso模型筛选出的组变量,基于Logistic回归模型得出骨质疏松性骨折预测工具:P=-1.88+0.437*BMD+0.289*年龄+0.023*大米面条-0.007*奶制品-0.096*豆制品-0.128*肉类-0.084*鱼类-0.007*新鲜蔬菜-0.018*蛋类+0.047*海藻类+0.048*身高-0.035*是否变矮-0.081*初潮年龄+0.171*是否绝经+0.121*绝经年限+0.039*怀孕次数+0.192*分娩次数-0.056*子宫卵巢是否切除+0.05*手足烦热-0.094*盗汗+0.008*腿软+0.15*目眩-0.048*视物模糊-0.045*目睛干涩-0.089*恶热+0.08*脱发+0.034*齿摇-0.101*口苦+0.004*易怒+0.054*午后潮热-0.056*失眠+0.019*多梦易惊-0.02*胸胁苦满+0.137*下肢转筋,对该预测模型预测概率绘制受试者工作特征曲线,结果显示曲线下面积AUC=0.878(95%CI=0.8412-0.9138)。
  4.2 基于决策树的模型构建
  根据决策树模型,骨折人群主要分类标准如下:①骨量异常患者且分娩次数超过1次者;②骨量异常患者,无分娩史但平日肉类摄入较少者;③骨量正常者,平日无目眩症状,但分娩次数超过1次且经常乏力者;④骨量正常患者,平日时有目眩症状但无视物模糊情况者;⑤骨量减少患者。对决策树预测模型预测概率绘制受试者工作特征曲线,结果显示曲线下面积AUC=0.871(95%CI=0.8226-0.9211)。
  5.两种模型的比较
  5.1 ROC曲线比较
  基于决策树分类模型与Logistic回归分析模型对于PMOP骨折的预测概率绘制ROC曲线。经计算,决策树模型的AUC值为0.871(95%CI=0.8226-0.9211);Logistic回归模型的AUC值为0.8775(95%CI=0.8412-0.9138)。根据AUC值的比较,两种模型均显示了良好的预测能力。
  5.2 样本量
  两种模型均对样本量要求较高。当试验样本量较小时,Logistic模型中回归系数的估计会出现较大误差,远离标准值;同样,决策树模型的分类准确性也受样本量大小影响。从理论与应用角度来说,Logistic回归模型的理论基础较为完善,应用范围广。该模型对于自变量是否符合正态分布没有硬性要求,能对不同数据类型的因变量进行回归建模,包括分类因变量、分类自变量、连续型自变量以及混合型变量,模型的应用范围很广。
  6.慢病风险预测模型构建机制
  本研究基于连续三年收集的社区人口数据,运用两种数学模型构建了两种预测效能较好的绝经后骨质疏松性骨折风险预测工具。进一步梳理本研究包含的注册登记研究与预测模型两个过程,凝练各环节关键点,初步得出慢病风险预测模型的构建机制。即①以疾病发生或终点指标作为结局变量:早期预警主要关注疾病发生或者疾病转归的终点结局,且指标必须具有国内外公认的诊断或判断标准;②采集与目标结局相关的关键信息:根据研究目标与实际情况,参考既往研究工作、国内外指南等,结合临床、方法学、统计学专家等共同讨论后确定采集内容,问卷是常见信息采集方式;③运用数理方法筛选中西医危险因素:基于临床流行病学调查获得长期随访数据,运用统计方法筛选关键变量。危险因素的识别、分层是制定预防策略的基础工作,从而指导早期预警和监测;④评价风险预测模型的预测性能:利用AUC值来评价风险预测模型的预测性能。
  研究结论:
  基于北京、上海两地共1129例40-65岁女性PMOP骨折高危人群数据信息,初步构建了PMOP骨折早期风险预测工具。将现代医学危险因素、中医特色临床症状、中医证候信息相结合,共同作为构建预测模型的参考变量,可提高疾病预测模型的准确性与实用性,为临床实践及推广应用提供可借鉴的理论依据与实用工具。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号