GEMV; GPU; Matrix-vector multiplication; Performance optimization;
机译:CUDA GPU库和新型稀疏矩阵 - 矢量乘法 - 非结构化有限元计算中的实现和性能增强
机译:GPU上用于快速稀疏矩阵矢量乘法的一系列位表示优化格式
机译:基于GPU稀疏矩阵矢量乘法统计的性能预测
机译:NVIDIA Kepler体系结构GPU上CRS格式的稀疏矩阵-矢量乘法的优化
机译:GPU上现代视频压缩中快速运动估计的设计与实现
机译:使用pmemdGTI进行快速准确的结合亲和力预测:GPU加速的热力学集成的有效实现
机译:基于Shuffle缩减基于稀疏矩阵 - 矢量乘法在开普勒GPU上