首页> 美国卫生研究院文献>Nature Communications >Fast and covariate-adaptive method amplifies detection power in large-scale multiple hypothesis testing
【2h】

Fast and covariate-adaptive method amplifies detection power in large-scale multiple hypothesis testing

机译:快速和协变量自适应的方法放大了大规模多重假设测试中的检测能力

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Multiple hypothesis testing is an essential component of modern data science. In many settings, in addition to the p-value, additional covariates for each hypothesis are available, e.g., functional annotation of variants in genome-wide association studies. Such information is ignored by popular multiple testing approaches such as the Benjamini-Hochberg procedure (BH). Here we introduce AdaFDR, a fast and flexible method that adaptively learns the optimal p-value threshold from covariates to significantly improve detection power. On eQTL analysis of the GTEx data, AdaFDR discovers 32% more associations than BH at the same false discovery rate. We prove that AdaFDR controls false discovery proportion and show that it makes substantially more discoveries while controlling false discovery rate (FDR) in extensive experiments. AdaFDR is computationally efficient and allows multi-dimensional covariates with both numeric and categorical values, making it broadly useful across many applications.
机译:多重假设检验是现代数据科学的重要组成部分。在许多情况下,除了p值外,还可以使用每种假设的其他协变量,例如,在全基因组关联研究中对变体进行功能注释。诸如Benjamini-Hochberg程序(BH)等流行的多种测试方法会忽略此类信息。在这里,我们介绍AdaFDR,这是一种快速而灵活的方法,可以从协变量中自适应地学习最佳p值阈值,从而显着提高检测能力。在对GTEx数据进行eQTL分析时,在相同的错误发现率下,AdaFDR发现的关联比BH多32%。我们证明了AdaFDR控制着错误发现的比例,并证明了它在广泛的实验中在控制错误发现率(FDR)的同时进行了更多的发现。 AdaFDR具有高效的计算能力,并允许使用带有数值和分类值的多维协变量,使其在许多应用程序中具有广泛的用途。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号