首页> 外文期刊>Mathematical Problems in Engineering >Efficient CSR-Based Sparse Matrix-Vector Multiplication on GPU
【24h】

Efficient CSR-Based Sparse Matrix-Vector Multiplication on GPU

机译:GPU上基于CSR的高效矩阵向量乘法

获取原文
获取原文并翻译 | 示例

摘要

Sparse matrix-vector multiplication (SpMV) is an important operation in scientific computations. Compressed sparse row (CSR) is the most frequently used format to store sparse matrices. However, CSR-based SpMVs on graphic processing units (GPUs), for example, CSR-scalar and CSR-vector, usually have poor performance due to irregular memory access patterns. This motivates us to propose a perfect CSR-based SpMV on the GPU that is called PCSR. PCSR involves two kernels and accesses CSR arrays in a fully coalesced manner by introducing a middle array, which greatly alleviates the deficiencies of CSR-scalar (rare coalescing) and CSR-vector (partial coalescing). Test results on a single C2050 GPU show that PCSR fully outperforms CSR-scalar, CSR-vector, and CSRMV and HYBMV in the vendor-tuned CUSPARSE library and is comparable with a most recently proposed CSR-based algorithm, CSR-Adaptive. Furthermore, we extend PCSR on a single GPU to multiple GPUs. Experimental results on four C2050 GPUs show that no matter whether the communication between GPUs is considered or not PCSR onmultiple GPUs achieves good performance and has high parallel efficiency.
机译:稀疏矩阵向量乘法(SpMV)是科学计算中的重要操作。压缩稀疏行(CSR)是存储稀疏矩阵的最常用格式。但是,由于不规则的内存访问模式,图形处理单元(GPU)上基于CSR的SpMV(例如CSR标量和CSR矢量)通常具有较差的性能。这激励我们在GPU上提出一种完美的基于CSR的SpMV,称为PCSR。 PCSR包含两个内核,并通过引入中间数组以完全合并的方式访问CSR数组,这大大减轻了CSR标量(稀疏合并)和CSR向量(部分合并)的不足。在单个C2050 GPU上的测试结果表明,在厂商调整的CUSPARSE库中,PCSR的性能完全优于CSR标量,CSR矢量,CSRMV和HYBMV,并且可以与最新提出的基于CSR的算法CSR-Adaptive相媲美。此外,我们将单个GPU上的PCSR扩展到多个GPU。在四个C2050 GPU上的实验结果表明,无论是否考虑GPU之间的通信,多个GPU上的PCSR都可以实现良好的性能并具有很高的并行效率。

著录项

  • 来源
    《Mathematical Problems in Engineering》 |2016年第11期|4596943.1-4596943.14|共14页
  • 作者

    He Guixia; Gao Jiaquan;

  • 作者单位

    Zhejiang Univ Technol, Zhijiang Coll, Hangzhou 310024, Zhejiang, Peoples R China;

    Zhejiang Univ Technol, Coll Comp Sci & Technol, Hangzhou 310023, Zhejiang, Peoples R China;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号