Department of Electrical and Computer Engineering Virginia Tech, Blacksburg, Virginia 24061;
机译:使用块间同步来改善GPU上的背包问题
机译:StreamScan:无需全局屏障同步的GPU快速扫描算法
机译:通过引入矩阵表示来平衡占用率并减少块间通信,从而增强了GPU上的膜计算模型实现
机译:通过快速屏障同步实现块间GPU通信
机译:微体系结构支持,用于提高gpus上simd执行的同步性和效率。
机译:GpU-Fs-KNN:一个软件工具用于快速可扩展的kNN计算使用的GpU
机译:通过快速屏障同步进行块间GPU通信