首页> 美国卫生研究院文献>Bioinformatics >EM-random forest and new measures of variable importance for multi-locus quantitative trait linkage analysis
【2h】

EM-random forest and new measures of variable importance for multi-locus quantitative trait linkage analysis

机译:EM随机森林和多场所定量性状连锁分析的重要度新措施

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

>Motivation: We developed an EM-random forest (EMRF) for Haseman–Elston quantitative trait linkage analysis that accounts for marker ambiguity and weighs each sib-pair according to the posterior identical by descent (IBD) distribution. The usual random forest (RF) variable importance (VI) index used to rank markers for variable selection is not optimal when applied to linkage data because of correlation between markers. We define new VI indices that borrow information from linked markers using the correlation structure inherent in IBD linkage data.>Results: Using simulations, we find that the new VI indices in EMRF performed better than the original RF VI index and performed similarly or better than EM-Haseman–Elston regression LOD score for various genetic models. Moreover, tree size and markers subset size evaluated at each node are important considerations in RFs.>Availability: The source code for EMRF written in C is available at >Contact: >Supplementary information: are available at
机译:>动机:我们开发了用于Haseman-Elston定量性状连锁分析的EM随机森林(EMRF),该分析可解释标记的歧义,并根据后裔相同后代(IBD)分布权衡每个同胞对。当应用于链接数据时,由于标记之间的相关性,用于对标记进行排名以进行变量选择的常规随机森林(RF)变量重要性(VI)索引并不是最佳的。我们使用IBD链接数据中固有的相关结构定义了从链接标记中借用信息的新VI索引。>结果:通过仿真,我们发现EMRF中的新VI索引的性能要优于原始RF VI索引并且在各种遗传模型中的表现都比EM-Haseman-Elston回归LOD分数相似或更好。此外,在每个节点处评估的树大小和标记子集大小是RF中的重要考虑因素。>可用性:用C语言编写的EMRF的源代码可在> Contact: >补充信息:

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号