Sparse matrices; Computer architecture; Kernel; Matrix decomposition; Parallel processing; Graphics processing units; Libraries;
机译:外部产品并行稀疏矩阵-矩阵乘法的同时输入和输出矩阵划分
机译:A 7.3 M输出非零/ j,11.7 m输出非零/ GB可重新配置稀疏矩阵矩阵乘法加速器
机译:SWM:高性能稀疏 - Winograd矩阵乘法CNN加速器
机译:超空间:基于外部产品的稀疏矩阵乘法加速器
机译:快速减少杂散光的空间变化卷积,使用稀疏矩阵变换的快速矩阵向量乘法以及fMRI数据分析中的激活检测。
机译:使用AVX-512指令的处理器上没有零填充的基于块的内核计算稀疏矩阵矢量产品
机译:外部乘积并行稀疏矩阵矩阵乘法的同时输入和输出矩阵划分