首页> 美国卫生研究院文献>G3: GenesGenomesGenetics >BGData - A Suite of R Packages for Genomic Analysis with Big Data
【2h】

BGData - A Suite of R Packages for Genomic Analysis with Big Data

机译:BGData-用于大数据基因组分析的R套件套件

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

We created a suite of packages to enable analysis of extremely large genomic data sets (potentially millions of individuals and millions of molecular markers) within the R environment. The package offers: a matrix-like interface for .bed files (PLINK’s binary format for genotype data), a novel class of linked arrays that allows linking data stored in multiple files to form a single array accessible from the R computing environment, methods for parallel computing capabilities that can carry out computations on very large data sets without loading the entire data into memory and a basic set of methods for statistical genetic analyses. The package is accessible through CRAN and GitHub. In this note, we describe the classes and methods implemented in each of the packages that make the suite and illustrate the use of the packages using data from the UK Biobank.
机译:我们创建了一套软件包,以分析R环境中的超大型基因组数据集(可能有数百万个个体和数百万个分子标记)。该软件包提供:.bed文件的类似矩阵的接口(PLINK的基因型数据二进制格式),新颖的链接数组类,该链接数组允许将存储在多个文件中的数据链接成一个可从R计算环境访问的单个数组,并行计算功能可以对非常大的数据集进行计算,而无需将整个数据加载到内存中,并且还提供了一组用于统计遗传分析的基本方法。可通过CRAN和GitHub访问该软件包。在本说明中,我们描述了构成套件的每个程序包中实现的类和方法,并使用UK Biobank的数据说明了程序包的用法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号