机译:通过3m和4m方法实现高性能复数矩阵乘法
Univ Texas Austin, Dept Comp Sci, Austin, TX 78712 USA;
Univ Texas Austin, Dept Comp Sci, Austin, TX 78712 USA;
Linear algebra; DLA; high-performance; complex; matrix; multiplication; micro-kernel; kernel; BLAS; BLIS; 3m; 4m; induced;
机译:用于CPU和GPU架构的高性能矩阵矩阵乘法方法
机译:高精度稀疏矩阵-矢量相乘的高效实现及其在乘积型Krylov子空间方法中的应用
机译:零线性判别分析方法的新观点及其使用带有散射矩阵的随机矩阵乘法的快速实现
机译:高效的矩阵乘法方法可为离散多音频收发器实现接近最佳的信道缩短方法
机译:分析驱动设计的可重配置逻辑中的并行浮点矩阵乘法。
机译:基于三甲基硅烷(3MS)和四甲基硅烷(4MS)的α-SiCN:H /α-SiCO:H扩散阻挡膜的研究
机译:用于CpU和GpU架构的高性能矩阵 - 矩阵乘法方法