首页> 美国卫生研究院文献>Bioinformatics >LFQC: a lossless compression algorithm for FASTQ files
【2h】

LFQC: a lossless compression algorithm for FASTQ files

机译:LFQC:FASTQ文件的无损压缩算法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

>Motivation: Next Generation Sequencing (NGS) technologies have revolutionized genomic research by reducing the cost of whole genome sequencing. One of the biggest challenges posed by modern sequencing technology is economic storage of NGS data. Storing raw data is infeasible because of its enormous size and high redundancy. In this article, we address the problem of storage and transmission of large FASTQ files using innovative compression techniques.>Results: We introduce a new lossless non-reference based FASTQ compression algorithm named Lossless FASTQ Compressor. We have compared our algorithm with other state of the art big data compression algorithms namely gzip, bzip2, fastqz (Bonfield and Mahoney, 2013), fqzcomp (Bonfield and Mahoney, 2013), Quip (Jones et al., 2012), DSRC2 (Roguski and Deorowicz, 2014). This comparison reveals that our algorithm achieves better compression ratios on LS454 and SOLiD datasets.>Availability and implementation: The implementations are freely available for non-commercial purposes. They can be downloaded from .>Contact:
机译:>动机:下一代测序(NGS)技术通过降低整个基因组测序的成本,彻底改变了基因组研究。现代测序技术带来的最大挑战之一是NGS数据的经济存储。由于原始数据的巨大规模和高度冗余性,因此无法存储它们。在本文中,我们使用创新的压缩技术解决了大型FASTQ文件的存储和传输问题。>结果:我们介绍了一种新的基于无损非引用的FASTQ压缩算法,称为无损FASTQ Compressor。我们将我们的算法与其他先进的大数据压缩算法进行了比较,例如gzip,bzip2,fastqz(Bonfield和Mahoney,2013),fqzcomp(Bonfield和Mahoney,2013),Quip(Jones等人,2012),DSRC2( Roguski和Deorowicz,2014年)。这种比较表明,我们的算法在LS454和SOLiD数据集上实现了更好的压缩率。>可用性和实现:这些实现可免费用于非商业目的。可以从以下网站下载它们。>联系方式:

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号