首页> 外文期刊>電子情報通信学会技術研究報告 >低メモリ帯域で高性能ステンシル計算を実現するスケーラブルストリーミングアレイの試作と評価
【24h】

低メモリ帯域で高性能ステンシル計算を実現するスケーラブルストリーミングアレイの試作と評価

机译:低存储频段高性能模版计算的可扩展流阵列的开发与评估

获取原文
获取原文并翻译 | 示例
       

摘要

Stencil computation is one of the important kernels in scientific computations, however, the sustained performance is limited by memory bandwidth on multi-core processors and GPGPUs due to its small operational-intensity. In this paper, we propose a scalable streaming-array (SSA), which allows multiple FPGAs to achieve linearly-scalable stencil computation by deeply pipelining with a constant external-memory bandwidth. We present a design of SSA and formulate a performance model of the pipelined execution. For 2D Jacobi computations, SSA implemented on nine Stratix III FPGAs with the memory bandwidth of only 2 GB/s achieves 260 GFlop/s, corresponding to 87.4 % of the peak, due to the linear speedup obtained for larger than medium-sized computation.%ステンシル計算は科学技術計算において重要な計算力ーネルの一つであるものの、その小さな演算密度のために、マルチコアプロセッサやGPGPUでは限られたメモリ帯域により実効性能が制約されてしまう。本研究では、複数のFPGAから成るシステムにおいて高性能ステンシル計算を実現するスケーラブルストリーミングアレイ(SSA)を提案する。SSAは、多段のパイプライン処理により、一定の外部メモリ帯域に対して線形の速度向上を実現する。本稿では、SSAの設計を示すと共に、複数のFPGAに対する性能モデルを導出する。9つのStratix ⅢFPGAを用いて実装されたSSAは、僅か2GB/sの外部メモリ帯域に対してピーク性能の87.4%にあたる260GFlop/sの2次元ヤコピ計算を実現した。これは、中規模以上の計算サイズ対して得られる線形の速度向上によるものである。
机译:模板计算是科学计算中的重要内核之一,但是由于其运算强度小,其持续性能受到多核处理器和GPGPU的内存带宽的限制。本文提出了一种可扩展流阵列(SSA) ),从而允许多个FPGA通过以恒定的外部存储器带宽进行深度流水线化来实现线性可扩展的模具计算。我们提出了SSA的设计并制定了流水线执行的性能模型。对于2D Jacobi计算,SSA在9个Stratix上实现III型FPGA的内存带宽仅为2 GB / s,达到260 GFlop / s,相当于峰值的87.4%,这是由于中大型计算获得的线性加速所致。%模板计算在科学技术计算中很重要。尽管它是计算能力的通道之一,但由于有限的内存带宽,其较小的计算密度限制了多核处理器和GPGPU的有效性能。在这项研究中,我们提出了一种可伸缩流阵列(SSA),该系统可在由多个FPGA组成的系统中实现高性能的模板计算。 SSA通过多阶段流水线处理实现了固定外部存储器带宽的线性速度提高。在本文中,我们展示了SSA的设计并导出了多个FPGA的性能模型。通过使用9个Stratix III FPGA实现的SSA已实现了260 GFlop / s的二维Jakopi计算,对于仅2 GB / s的外部存储器带宽,这是峰值性能的87.4%。这是由于中型和大型计算量获得了线性加速。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号