首页> 外文会议>ACM/EDAC/IEEE Design Automation Conference >VWS: A versatile warp scheduler for exploring diverse cache localities of GPGPU applications
【24h】

VWS: A versatile warp scheduler for exploring diverse cache localities of GPGPU applications

机译:VWS:多功能的warp调度程序,用于探索GPGPU应用程序的各种缓存位置

获取原文

摘要

Massive multi-threading of GPGPU demands for efficient usage of caches with limited capacity. In this work, we propose a versatile warp scheduler (VWS) to reduce the cache miss rate in GPGPU. VWS retains the intra-warp cache locality using an efficient per-warp working set estimator and enhances intra-/inter-cooperative thread array (CTA) cache locality through imposing a CTA-aware scheduling policy and a new CTA dispatching mechanism. The significantly improved hit rate of cache hierarchy enables VWS to achieve on average 38.4% and 9.3% IPC improvement across diverse GPGPU applications compared to a widely-used and a state-of-the-art warp schedulers, respectively.
机译:GPGPU的大规模多线程要求有效利用有限容量的缓存。在这项工作中,我们提出了一种通用的翘曲调度程序(VWS),以减少GPGPU中的缓存丢失率。 VWS使用高效的每组工作集估计器保留了warp内的缓存局部性,并通过实施可识别CTA的调度策略和新的CTA调度机制来增强了协作内/协作间线程阵列(CTA)的缓存局部性。与广泛使用和最新的翘曲调度器相比,高速缓存层次结构的命中率显着提高,使VWS在各种GPGPU应用程序中的IPC平均提高38.4%和9.3%。

著录项

相似文献

  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号