首页> 中文期刊> 《西安交通大学学报(医学版)》 >高维生物医学数据变量筛选方法的模拟研究

高维生物医学数据变量筛选方法的模拟研究

         

摘要

目的 比较5种常用的变量筛选方法在高维生物医学数据变量筛选中的实际效果,探讨样本量和变量间关联性对变量筛选效果的影响,为制定高维生物医学数据分析中的变量筛选策略提供依据.方法 基于R语言实现变量筛选算法,通过Monte Carlo算法模拟产生不同条件下的高维数据,用于评估和比较不同方法在特定数据条件下的变量筛选效果.以筛选结果的真阳性率、真阴性率作为变量筛选效果的评价指标.结果 在设定的高维数据情况下,样本量增加时,各变量筛选方法的筛选效果均变好,变量间的关联性对变量筛选的效果也有影响.模拟结果显示,5种方法中弹性网算法的变量筛选效果最好,LASSO算法次之,岭回归算法完全没有起到变量筛选的作用.结论 在进行高维生物医学数据的变量筛选时,弹性网算法是一种比较理想的变量筛选方法.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号