...
首页> 外文期刊>Parallel Computing >Scalable parallel suffix array construction
【24h】

Scalable parallel suffix array construction

机译:可扩展的并行后缀数组构造

获取原文
获取原文并翻译 | 示例
           

摘要

Suffix arrays are a simple and powerful data structure for text processing that can be used for full text indexes, data compression, and many other applications in particular in bioinformatics. We describe the first implementation and experimental evaluation of a scalable parallel algorithm for suffix array construction. The implementation works on distributed memory computers using MPI, Experiments with up to 512 processors show good constant factors and make it look likely that the algorithm could also be adapted to even larger systems. This makes it possible to build suffix arrays for huge inputs very quickly. Our algorithm is a parallelization of the linear time DC3 algorithm.
机译:后缀数组是用于文本处理的简单而强大的数据结构,可用于全文索引,数据压缩以及许多其他应用程序,尤其是在生物信息学中。我们描述了后缀数组构造的可伸缩并行算法的第一个实现和实验评估。该实现可在使用MPI的分布式内存计算机上运行。多达512个处理器的实验显示出良好的恒定因子,并使得该算法似乎也可能适用于更大的系统。这使得可以非常快速地为大量输入构建后缀数组。我们的算法是线性时间DC3算法的并行化。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号