机译:多核CPU上不规则内存流量的缓存仿真:稀疏矩阵乘法性能模型的案例研究
Simula Research Laboratory P.O. Box 134 1325 Lysaker Norway University of Oslo Oslo Norway;
Simula Research Laboratory P.O. Box 134 1325 Lysaker Norway;
Simula Research Laboratory P.O. Box 134 1325 Lysaker Norway University of Oslo Oslo Norway;
Cache simulation; Performance model; Sparse matrix-vector multiplication; Intel Xeon; AMD Epyc;
机译:标量多核CPU上的并行对称稀疏矩阵矢量积
机译:基于超图分区的稀疏矩阵矢量乘法中利用缓存局部性的模型和方法
机译:在CPU上使用重排序技术优化稀疏矩阵矢量乘法
机译:用于不规则问题的建模与改进局部性:缓存记忆中稀疏矩阵 - 矢量产品作为案例研究
机译:小型有限字段高性能稀疏矩阵矢量乘法分析
机译:具有多核CPUGPU和MIC的系统上的应用程序性能分析和高效执行:以显微镜图像分析为例
机译:基于超图分区的稀疏矩阵矢量乘法中利用缓存局部性的模型和方法