首页> 外文会议>プログラミング・シンポジウム >OpenACCによる共役勾配法カーネルコードの並列化と実行性能評価
【24h】

OpenACCによる共役勾配法カーネルコードの並列化と実行性能評価

机译:通过OPENACC的共轭梯度方法通过核心代码的OPENACC ACC并行化和性能评估

获取原文

摘要

近年,HPC分野では様々な並列計算機が登場しており,効率的にプログラムの並列 化をする手法が検討されている.特にGPUの利用には専用開発環境CUDAを用いる必要 があるため開発の敷居が高いとされていたが,ディレクティブを記述するだけでGPUが利 用可能となるOpenACCが登場した.しかしながら,OpenACCは発展途上の手法であり CUDAでの実装や他の並列計算機との比較研究が少ない.本研究の目的は,連立一次方程 式ソルバーの1つである共役勾配法のカーネルコードをOpenACCを用いて並列化した際 の実行性能を各環境で評価することである.評価には共役勾配法のカーネルコードに対して OpenACC, OpenMP, CUDAを適用し,Xeon (Skylake), GPU (P100), FX100環境を用い て実行性能の比較を行う.結果,FX100に対しOpenACCを用いたP100の実行性能は3.6 倍以上の高速化を達成した.
机译:近年来,各种并行计算机简单地通过描述指令出现在HPC领域,有效地并行程序的方法已经被考虑。开发环境CUDA的发展,特别是对使用的GPU然而,OpenACC的,可能与GPU的使用。然而,OpenACC的是一个显影方法,并用在CUDA执行和其他并行计算机的比较研究本研究的目的是评价与OpenACC的,这是使用OpenACC的一种用于共轭同时初级方程解算器的一个并行执行性能评估应用OpenACC的特性,OpenMP,CUDA于梯度法的内核代码和比较使用至强(SKYLAKE微架构)的执行性能,GPU(P100),和FX100环境。其结果是,P100使用OpenACC的为3.6倍FX100执行性能达到加速度或者更多。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号