CUDA; GPU; Strassen's algorithm; Winograd's variant; accuracy; matrix multiplication;
机译:使用具有多个FFT大小的斯特拉斯森算法的GPU进行高精度整数乘法
机译:通过使用具有多个FFT大小的斯特拉斯森算法的GPU进行高精度整数乘法
机译:TSM2X:GPU上的高性能高瘦矩阵矩阵乘法
机译:在GPU上加速Strassen-Winograd的矩阵乘法算法
机译:在GPU上优化高而瘦的矩阵矩阵乘法
机译:BLAMM:基于BLAS的算法用于查找CPU和GPU上DNA序列中的位置权重矩阵
机译:Strassen在GPU上的矩阵乘法