【24h】

High-Performance Parallel FFT Algorithms for the HITACHI SR8000

机译:适用于HITACHI SR8000的高性能并行FFT算法

获取原文
获取外文期刊封面目录资料

摘要

In this paper, we propose high-performance paral-lel one-dimensional fast Fourier transform (FFT) algo-rithms for distributed-memory parallel computers with vector symmetric multiprocessor (SMP) nodes. The four-step FFT algorithm can be altered into a five-step FFT algorithm to expand the innermost loop length. We use the four-step and five-step algorithms to im-plement the parallel one-dimensional FFT algorithms. In our proposed parallel FFT algorithms, since we use cyclic distribution, all-to-all communication takes place only once. Moreover, the input data and output data are both in natural order. Performance results of one-dimensinonal power-of-two FFE_s on a distributed-memory parallel computer with (pseudo)_ vector SMP nodes, HITACHI SR8000, are reported. We succeeded in obtaining performance of about 38 GFLOPS on a 16-node SR8000.
机译:在本文中,我们为具有向量对称多处理器(SMP)节点的分布式内存并行计算机提出了高性能的paral-lel一维快速傅立叶变换(FFT)算法。可以将四步FFT算法更改为五步FFT算法,以扩展最内部的循环长度。我们使用四步法和五步法来实现并行的一维FFT算法。在我们提出的并行FFT算法中,由于我们使用循环分布,因此所有通信仅发生一次。此外,输入数据和输出数据都具有自然顺序。报告了在具有(伪)_向量SMP节点HITACHI SR8000的分布式内存并行计算机上,一维二乘二FFE_s的性能结果。我们在16节点SR8000上成功获得了约38 GFLOPS的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号