机译:很小矩阵的高性能矩阵矩阵乘法的算法和优化技术
Univ Manchester, Manchester, Lancs, England;
Univ Paris Sud, Paris, France;
Inria Bordeaux, Talence, France;
Univ Tennessee, Innovat Comp Lab, Knoxville, TN USA;
Matrix-matrix product; Batched GEMM; Small matrices; HPC; Autotuning; Optimization;
机译:半经验分子动力学(SEMD)I:具有衰减的矩阵的基于中点的并行稀疏矩阵-矩阵乘法算法
机译:并行稀疏矩阵-矩阵乘法的寄存器感知优化
机译:TSM2X:GPU上的高性能高瘦矩阵矩阵乘法
机译:很小矩阵的高性能矩阵-矩阵乘法
机译:在GPU上优化高而瘦的矩阵矩阵乘法
机译:使用替代的编程算法和技术来优化Casemix软件的性能
机译:非常小矩阵高性能矩阵矩阵乘法的算法和优化技术