首页> 中文期刊> 《数字化用户》 >Hadoop分布式系统在生物信息分析和计算中的应用

Hadoop分布式系统在生物信息分析和计算中的应用

         

摘要

生物信息工程中常见的全基因测序和重序分析等应用通常需要大量的运算和对大量的数据进行分析.在传统单机上运行,这需要几个星期时间才能完成一个分析,非常耗时.因此,Hadoop的MapReduce分布式计算平台就为这类大数据分析运算提供了强有力的支持.当前生物信息学应用都需要管理大量数据和大量计算,主要是应用并行计算.第一个特点是流媒体大数据集的计算,而第二个则需要一个相对较小的数据集的多遍计算策略.这些算法的分析与广泛复杂的应用有关,例如结构基因组学和全基因组关联研究.在这门学科中,MapReduce是一种特别通用并且可以并行计算的技术.在这里报告其应用,使用它的开源实现Hadoop,涉及到两个相关的算法:BLAST和GSEA.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号