Scan; Prefix-sum; OpenCL; CUDA; GPU; Parallel algorithms;
机译:StreamScan:无需全局屏障同步的GPU快速扫描算法
机译:使用GPU的并行源扫描算法
机译:通过Megakernels实现GPU上的高效快速卷积算法
机译:StreamScan:没有全局屏障同步的GPU的快速扫描算法
机译:GPU上的计算电磁学和微电磁学的快速算法和求解器。
机译:用于扫描透射电子显微镜的图像模拟算法的流式多GPU实现
机译:GPU上的快速细粒度全局同步