首页> 中文学位 >Random Lasso在Logistic模型中的应用研究——基于心脏病诊断数据集
【6h】

Random Lasso在Logistic模型中的应用研究——基于心脏病诊断数据集

代理获取

目录

声明

1 绪论

1.1选题背景及意义

1.2文献综述

1.2.1国外研究现状

1.2.2国内研究现状

1.3研究内容和创新点

1.3.1本文研究内容

1.3.2创新点

1.3.3技术路线图

2 基础理论

2.1模型理论

2.1.1普通线性模型

2.1.2广义线性模型

2.2常见变量选择方法

2.2.1 Lasso方法

2.2.2 Elastic Net方法

2.2.3 Adaptive Lasso方法

2.3调节参数的选择

2.4 Logistic模型的变量选择与估计

3 Random Lasso在Logistic模型中的算法原理

3.1 Bootstrap自助法

3.2 Random Lasso算法原理

4 Random Lasso在Logistic模型中的实证分析与对比

4.1心脏病诊断数据集说明

4.2不同变量选择方法下的Logistic模型分类结果

4.2.1分类评价指标

4.2.2 Random Lasso 下建模与分类

4.2.3 Lasso下建模与分类

4.2.4 Elastic Net下建模与分类

4.2.5 Adaptive Lasso下建模与分类

4.3结果分析与对比

5 总结与展望

5.1总结

5.2本文不足和对未来的展望

参考文献

附录

致谢

展开▼

摘要

在现在的信息化大数据时代,获取的数据信息太多太杂,同时,搜集的变量也越多,从中提取有价值的变量来建模造成了一定的困难。因此,通过有效的变量选择方法来对模型进行处理就变得非常重要。广义线性模型是实际中应用非常广泛的模型,虽然变量选择问题在该模型中的研究和应用已有不少,但在处理高维并且具有强相关性的数据的变量选择方法在该领域研究较少。本文将Random Lasso方法推广至广义线性模型中做变量选择,并应用在疾病诊疗领域。通过对一组疾病诊疗数据建立Logistic分类模型,从而判断疾病的分类。本文还将Random Lasso方法与常见的Lasso、Elastic Net和Adaptive Lasso变量选择方法进行对比,评价各方法下的模型分类性能。通过绘制ROC曲线并计算曲线下面积AUC的值,同时结合其他分类评价指标,得出Random Lasso方法下建立的模型分类效果比其余三种常见变量选择方法的效果显著。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号