机译:生成用于不断发展的GPU硬件的最佳CUDA稀疏矩阵矢量乘积实现
ANU Supercomputer Facility, Leonard Huxley Building (#56), The Australian National University, Canberra, ACT 0200, Australia;
School of Computer Science, The Australian National University, Canberra, ACT 0200, Australia;
CUDA; GPU; NVIDIA; sparse; matrix-vector; fermi; S2050;
机译:CUDA GPU库和新型稀疏矩阵 - 矢量乘法 - 非结构化有限元计算中的实现和性能增强
机译:使用原子运算在GPU上启用CUDA的稀疏矩阵向量乘法
机译:启用CUDA的GPU上稀疏矩阵向量乘法的切片COO格式
机译:从稀疏矩阵到最佳GPU CUDA稀疏矩阵矢量乘积实现
机译:探索在内存中处理架构上加速稀疏矩阵矢量乘积的潜力
机译:兼容CUDA的GPU卡可作为Smith-Waterman序列比对的高效硬件加速器
机译:启用CUDA的GPU上稀疏矩阵向量乘法的切片COO格式