首页> 美国卫生研究院文献>Bioinformation >Compression of Large genomic datasets using COMRAD on Parallel Computing Platform
【2h】

Compression of Large genomic datasets using COMRAD on Parallel Computing Platform

机译:在并行计算平台上使用COMRAD压缩大型基因组数据集

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

The big data storage is a challenge in a post genome era. Hence, there is a need for high performance computing solutions for managing large genomic data. Therefore, it is of interest to describe a parallel-computing approach using message-passing library for distributing the different compression stages in clusters. The genomic compression helps to reduce the on disk“foot print” of large data volumes of sequences. This supports the computational infrastructure for a more efficient archiving. The approach was shown to find utility in 21 Eukaryotic genomes using stratified sampling in this report. The method achieves an average of 6-fold disk space reduction with three times better compression time than COMRAD.AvailabilityThe source codes are written in C using message passing libraries and are available at
机译:在后基因组时代,大数据存储是一个挑战。因此,需要用于管理大型基因组数据的高性能计算解决方案。因此,有必要描述一种使用消息传递库的并行计算方法,以在群集中分布不同的压缩阶段。基因组压缩有助于减少大序列数据量在磁盘上的“占用空间”。这支持了计算基础架构,以实现更有效的归档。在本报告中,使用分层采样显示该方法可在21个真核生物基因组中找到效用。该方法平均可减少磁盘空间6倍,压缩时间是COMRAD的三倍。可用性源代码使用C语言编写,使用消息传递库,并且可以在以下位置获得

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号