首页> 美国卫生研究院文献>Proceedings of the National Academy of Sciences of the United States of America >Linkage disequilibrium matches forensic genetic records to disjoint genomic marker sets
【2h】

Linkage disequilibrium matches forensic genetic records to disjoint genomic marker sets

机译:连锁不平衡使法医遗传记录与基因组标记集脱节

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Combining genotypes across datasets is central in facilitating advances in genetics. Data aggregation efforts often face the challenge of record matching—the identification of dataset entries that represent the same individual. We show that records can be matched across genotype datasets that have no shared markers based on linkage disequilibrium between loci appearing in different datasets. Using two datasets for the same 872 people—one with 642,563 genome-wide SNPs and the other with 13 short tandem repeats (STRs) used in forensic applications—we find that 90–98% of forensic STR records can be connected to corresponding SNP records and vice versa. Accuracy increases to 99–100% when ∼30 STRs are used. Our method expands the potential of data aggregation, but it also suggests privacy risks intrinsic in maintenance of databases containing even small numbers of markers—including databases of forensic significance.
机译:跨数据集组合基因型是促进遗传学发展的关键。数据聚合工作通常面临记录匹配的挑战-识别代表同一个人的数据集条目。我们显示记录可以跨基因型数据集进行匹配,这些基因型数据集基于不同数据集中出现的基因座之间的连锁不平衡而没有共享标记。使用同一人的两个数据集(一个具有642,563个全基因组SNP,另一个具有13个短串联重复序列(STR))用于法医学应用,我们发现90-98%的法医学STR记录可以与相应的SNP记录相关反之亦然。当使用约30个STR时,精度会提高到99–100%。我们的方法扩大了数据聚合的潜力,但是它也暗示了维护包含少量标记的数据库(包括具有法医学意义的数据库)固有的隐私风险。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号