【24h】

A Sequence-Focused Parallelisation of EMBOSS on a Cluster of Workstations

机译:工作站集群上基于序列的EMBOSS并行化

获取原文
获取原文并翻译 | 示例

摘要

A number of individual bioinformatics applications (particularly BLAST and other sequence searching methods) have recently been implemented over clusters of workstations to take advantage of extra processing power. Performance improvements are achieved for increasingly large sets of input data (sequences and databases), using these implementations. We present an analysis of programs in the EMBOSS suite based on increasing sequence size, and implement these programs in parallel over a cluster of workstations using sequence segmentation with overlap. We observe general increases in runtime for all programs, and examine the speedup for the most intensive ones to establish an optimum segmentation size for those programs across the cluster.
机译:最近,在工作站集群上实现了许多单独的生物信息学应用程序(特别是BLAST和其他序列搜索方法),以利用额外的处理能力。使用这些实现,可以对越来越多的输入数据集(序列和数据库)实现性能改进。我们基于不断增加的序列大小对EMBOSS套件中的程序进行了分析,并使用重叠的序列分段在工作站集群上并行实现了这些程序。我们观察到所有程序的运行时间普遍增加,并检查最密集程序的运行速度,以为整个集群中的这些程序确定最佳分段大小。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号