首页> 外文会议>Calable high performance computing conference >An efficient parallel algorithm for the 3-D FFT NAS parallel benchmark
【24h】

An efficient parallel algorithm for the 3-D FFT NAS parallel benchmark

机译:3-D FFT NAS并联基准测试的高效并行算法

获取原文

摘要

We propose an efficient algorithm to implement the 3D NAS FFT benchmark. The proposed algorithm overlaps the communication with the computation. On parallel machines supporting overlap of communication with computation, the proposed algorithm can outperform the non-overlapping version of this algorithm by a factor close to two.
机译:我们提出了一种高效的算法来实现3D NAS FFT基准。所提出的算法与计算与通信重叠。在支持与计算重叠的并行机器上,所提出的算法可以将该算法的非重叠版本优于两个接近的算法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号