首页> 中文期刊> 《中国卫生统计》 >AIC结合最优子集法构建logistic回归模型在预测2型糖尿病并发末梢神经病变中的应用

AIC结合最优子集法构建logistic回归模型在预测2型糖尿病并发末梢神经病变中的应用

         

摘要

目的 研究如何快速有效地进行变量的筛选,建立起准确可靠的logistic回归预测模型;针对小样本的特性,如何对模型的泛化能力(即预测性能)进行可靠的评价;并在数据集来源于分离抽样时,对模型进行过抽样的调整,使调整后的结果适用于人群预测疾病发生的可能性.方法 以2型糖尿病并发末梢神经病变数据为例,采用最优子集法与AIC信息准则相结合对变量进行快速方便的筛选,并采用Monte Carlo模拟抽样的方法(具体为10~100次的3~10折分层交叉验证法)对模型的泛化能力作出评价和比较.结果 采用最优子集法与AIC信息准则相结合建立的logistic回归模型,准确率为79.6%,ROC面积为0.8802,经分层交叉验证法验证,泛化能力优于用一般筛选变量方法建立的模型;用先验概率对后验概率进行过抽样的调整,使调整后的结果适用于人群预测疾病发生的可能性.结论 建立logistic回归预测模型时,应根据实际情况,尽量尝试多种筛选变量的建模策略,在小样本情况下,若欲对模型的泛化能力做出可靠的评价,可采用分层交叉验证的方法;当样本来源方式为分离抽样时,若研究目的 为建立预测模型,则应采用先验概率对后验概率进行调整.

著录项

  • 来源
    《中国卫生统计》 |2010年第6期|594-597,599|共5页
  • 作者单位

    天津医科大学公共卫生学院卫生统计学教研室,300070;

    天津医科大学公共卫生学院流行病学教研室;

    山东省青岛市胶州中心医院消化呼吸科,366300;

    天津医科大学公共卫生学院卫生统计学教研室,300070;

    天津医科大学公共卫生学院卫生统计学教研室,300070;

    天津医科大学公共卫生学院卫生统计学教研室,300070;

    天津医科大学公共卫生学院卫生统计学教研室,300070;

    天津医科大学公共卫生学院卫生统计学教研室,300070;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    logistic回归; 交叉验证法; 过抽样; 糖尿病并发末梢神经病变;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号