【24h】

Optimizing Sparse Matrix Vector Multiplication Using Cache Blocking Method on Fermi GPU

机译:在Fermi GPU上使用缓存阻止方法优化稀疏矩阵矢量乘法

获取原文
获取原文并翻译 | 示例

摘要

It is an important task to tune performance for sparse matrix vector multiplication (SpMV), but it is also a difficult task because of its irregularity. In this paper, we propose a cache blocking method to improve the performance of SpMV on the emerging GPU architecture. The sparse matrix is partitioned into many sub-blocks, which are stored in CSR format. With the blocking method, the corresponding part of vector x can be reused in the GPU cache, so the time spent on accessing the global memory for vector x is reduced heavily. Experimental results on GeForce GTX 480 show that SpMV kernel with the cache blocking method is 5x faster than the unblocked CSR kernel in the best case.
机译:调整稀疏矩阵矢量乘法(SpMV)的性能是一项重要任务,但由于其不规则性,这也是一项艰巨的任务。在本文中,我们提出了一种缓存阻止方法来提高SpMV在新兴GPU架构上的性能。稀疏矩阵被分成许多子块,这些子块以CSR格式存储。使用分块方法,向量x的相应部分可以在GPU缓存中重用,因此可以大大减少向量x的全局存储器访问时间。在GeForce GTX 480上的实验结果表明,在最佳情况下,采用缓存阻止方法的SpMV内核比未阻止的CSR内核快5倍。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号