机译:GPU的分层屋顶分析:加速NERSC-9 Perlmuter系统的性能优化
Lawrence Berkeley Natl Lab Natl Energy Res Sci Comp Ctr NERSC Berkeley CA 94720 USA;
Lawrence Berkeley Natl Lab Natl Energy Res Sci Comp Ctr NERSC Berkeley CA 94720 USA;
Lawrence Berkeley Natl Lab CRD Berkeley CA 94720 USA;
code optimization; Cray; NVIDIA GPU; performance analysis; Roofline; tensor core;
机译:基于车顶线模型的GPU三维FDTD性能分析和优化
机译:基于FPGA的海啸仿真:与GPU的性能比较以及用于可扩展性分析的Roofline模型
机译:使用Cray性能分析工具(CrayPat)进行屋顶线分析,以及基于屋顶线的性能预测以用于未来的体系结构
机译:GPU中的缓存感知车顶线模型和医学图像处理优化
机译:为复杂选择器价格定价并使用GPU加速其性能的归一化粒子群优化算法。
机译:具有多核CPUGPU和MIC的系统上的应用程序性能分析和高效执行:以显微镜图像分析为例
机译:GPU的分层屋顶分析:加速NERSC-9 Perlmuter系统的性能优化