机译:一种新的对角线存储,可用于高效实现图形处理单元上的稀疏矩阵 - vectiviplication
Zhejiang Univ Technol Zhijiang Coll Hangzhou Peoples R China;
Nanjing Normal Univ Sch Comp & Elect Informat Jiangsu Key Lab NSLSCS Nanjing 210023 Peoples R China;
Nanjing Normal Univ Sch Comp & Elect Informat Jiangsu Key Lab NSLSCS Nanjing 210023 Peoples R China;
CUDA; GPU; multidiagonal sparse matrices; sparse matrix#8211; vector multiplication; sparse storage format;
机译:稀疏矩阵向量乘法的新型多图形处理单元并行优化框架
机译:图形处理单元上大型稀疏线性系统的Jacobi迭代方法的有效实现
机译:在具有宽模拟单元的现代处理器上有效地通用稀疏矩阵-向量乘法的统一稀疏矩阵数据格式
机译:在图形处理单元上实现稀疏矩阵向量乘法的有效方法
机译:现代图形处理单元上的神经网络中心优化:算法和建筑视角
机译:图形处理单元(GpU)执行的图像处理算法以改善控制采集处理的系统的性能以及微造影荧光镜的图像显示系统(CapIDs)(maF)
机译:一种统一的稀疏矩阵数据格式,用于有效的一般稀疏 矩阵向量乘以具有宽sImD单位的现代处理器