首页> 美国卫生研究院文献>other >Utilizing Graph Theory to Select the Largest Set of Unrelated Individuals for Genetic Analysis
【2h】

Utilizing Graph Theory to Select the Largest Set of Unrelated Individuals for Genetic Analysis

机译:利用图论选择最大的遗传分析的无关个人集合

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Many statistical analyses of genetic data rely on the assumption of independence among samples. Consequently, relatedness is either modeled in the analysis or samples are removed to “clean” the data of any pairwise relatedness above a tolerated threshold. Current methods do not maximize the number of unrelated individuals retained for further analysis, and this is a needless loss of resources. We report a novel application of graph theory that identifies the maximum set of unrelated samples in any dataset given a user-defined threshold of relatedness as well as all networks of related samples. We have implemented this method into an open source program called Pedigree Reconstruction and Identification of a Maximum Unrelated Set, PRIMUS. We show that PRIMUS outperforms the three existing methods, allowing researchers to retain up to 50% more unrelated samples. A unique strength of PRIMUS is its ability to weight the maximum clique selection using additional criteria (e.g. affected status and data missingness). PRIMUS is a permanent solution to identifying the maximum number of unrelated samples for a genetic analysis.
机译:遗传数据的许多统计分析都依赖于样本间独立性的假设。因此,可以在分析中对相关性进行建模,也可以删除样本以“清理”高于容许阈值的任何成对相关性的数据。当前的方法不能最大化保留用于进一步分析的无关个人的数量,这是不必要的资源损失。我们报告了图论的一种新颖应用,它可以在给定用户定义的相关性阈值以及所有相关样本网络的情况下,在任何数据集中识别出最大数量的不相关样本。我们已经将此方法实施到一个名为“谱系重建和最大无关集识别” PRIMUS的开源程序中。我们显示PRIMUS的性能优于现有的三种方法,从而使研究人员可以保留多达50%的无关样品。 PRIMUS的独特优势在于它能够使用其他标准(例如,受影响的状态和数据丢失)对最大的集团选择进行加权。 PRIMUS是一种永久性解决方案,可用于鉴定最大数量的不相关样品进行遗传分析。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号