首页> 美国卫生研究院文献>BMC Bioinformatics >Variable selection for binary classification using error rate p-values applied to metabolomics data
【2h】

Variable selection for binary classification using error rate p-values applied to metabolomics data

机译:使用应用于代谢组学数据的错误率p值进行二元分类的变量选择

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

BackgroundMetabolomics datasets are often high-dimensional though only a limited number of variables are expected to be informative given a specific research question. The important task of selecting informative variables can therefore become complex. In this paper we look at discriminating between two groups. Two tasks need to be performed: (i) finding variables which differ between the two groups; and (ii) determining how the selected variables can be used to classify new subjects. We introduce an approach using minimum classification error rates as test statistics to find discriminatory and therefore informative variables. The thresholds resulting in the minimum error rates can be used to classify new subjects. This approach transforms error rates into p-values and is referred to as ERp.
机译:背景代谢组学数据集通常是高维的,尽管鉴于特定的研究问题,预计只有有限数量的变量可以提供信息。选择信息变量的重要任务因此可能变得复杂。在本文中,我们着眼于区分两组。需要执行两个任务:(i)查找两组之间不同的变量; (ii)确定如何使用所选变量对新主题进行分类。我们介绍一种使用最小分类错误率作为检验统计量的方法,以找到具有歧视性的信息量。导致最小错误率的阈值可用于对新主题进行分类。这种方法将错误率转换为p值,称为ERp。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号