University of Illinois at Urbana-Champaign.;
机译:通过基于分析的转换,提高多核/多核CPU上特定于GPU的OpenCL内核的性能可移植性
机译:通过基于分析的转换来提高多核/多核CPU上特定于GPU的OpenCL内核的性能可移植性*#
机译:PRAND:GPU加速的并行随机数生成库:使用最可靠的算法并应用现代GPU和CPU的并行性
机译:适用于针对英特尔CPU,IBM CPU和NVIDIA GPU的科学应用的OpenMP 4.5的生产率,可移植性和性能
机译:GPU和CPU上有效的viewShed计算算法
机译:BLAMM:基于BLAS的算法用于查找CPU和GPU上DNA序列中的位置权重矩阵
机译:适用于针对Intel CPU,IBM CPU和NVIDIA GPU的科学应用的OpenMP 4.5的生产率,可移植性和性能