机译:为GPU优化稀疏矩阵-矩阵乘法
Univ Illinois, Dept Comp Sci, Urbana, IL 61801 USA;
Univ Illinois, Dept Comp Sci, Urbana, IL 61801 USA;
Google, Mountain View, CA 94043 USA;
Algorithms; Performance; Parallel; sparse; GPU; matrix-matrix;
机译:基于寄存器的GPU稀疏常规矩阵矩阵乘法的实现
机译:GPU和异构处理器上的通用稀疏矩阵矩阵乘法的框架
机译:适用于多核和GPU架构的多线程稀疏矩阵矩阵乘法
机译:使用定制稀疏存储格式的高效稀疏密集矩阵矩阵乘法
机译:在GPU上优化高而瘦的矩阵矩阵乘法
机译:下一代加速和代码优化 使用GPU在混浊的介质中传输
机译:使用定制稀疏存储格式的高效稀疏密集矩阵矩阵乘法