【24h】

POSTER: GPUs Pipeline Latency Analysis

机译:海报:GPU管线延迟分析

获取原文

摘要

In this work, we propose a very low overhead and portable analysis for exposing the hidden latency of each individual instruction executing in the pipeline and different access latencies of the various memory hierarchies at the microarchitecture level. We also show the impact of the possible optimizations a CUDA compiler have over the various latencies. We run our evaluation on seven different high-end NVIDIA GPUs from five different generations/architectures namely: Kepler, Maxwell, Pascal, Volta, and Turing.
机译:在这项工作中,我们提出了一个非常低的开销和可移植性分析,以揭示在微体系结构级别在管道中执行的每条指令的隐藏等待时间以及各种内存层次结构的不同访问等待时间。我们还展示了CUDA编译器可能进行的优化对各种延迟的影响。我们对来自五种不同的代/体系结构的七个不同的高端NVIDIA GPU进行了评估,它们分别是:开普勒,麦克斯韦,帕斯卡,沃尔特和图灵。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号