首页> 外文会议>10th IEEE/ACM International Conference on Cluster, Cloud and Grid Computing >From Sparse Matrix to Optimal GPU CUDA Sparse Matrix Vector Product Implementation
【24h】

From Sparse Matrix to Optimal GPU CUDA Sparse Matrix Vector Product Implementation

机译:从稀疏矩阵到最佳GPU CUDA稀疏矩阵矢量乘积实现

获取原文
获取原文并翻译 | 示例

摘要

The CUDA model for GPUs presents the programmer with a plethora of different programming options. These includes different memory types, different memory access methods, and different data types. Identifying which options to use and when is a non-trivial exercise. This paper explores the effect of these different options on the performance of a routine that evaluates sparse matrix vector products. A process for analysing performance and selecting the subset of implementations that perform best is proposed. The potential for mapping sparse matrix attributes to optimal CUDA sparse matrix vector product implementation is discussed.
机译:用于GPU的CUDA模型为程序员提供了许多不同的编程选项。这些包括不同的内存类型,不同的内存访问方法和不同的数据类型。确定使用哪些选项以及何时使用是不平凡的练习。本文探讨了这些不同选项对评估稀疏矩阵向量乘积的例程的性能的影响。提出了一种用于分析性能并选择性能最佳的实现子集的过程。讨论了将稀疏矩阵属性映射到最佳CUDA稀疏矩阵矢量乘积实现的潜力。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号