Task-based parallelism; general-purpose GPU computing; Asynchronous data transfer;
机译:加速器:使用数据并行性为通用用途的GPU编程
机译:加速器:使用数据并行性为通用用途的GPU编程
机译:PRAND:GPU加速的并行随机数生成库:使用最可靠的算法并应用现代GPU和CPU的并行性
机译:直接在GPU上使用基于任务的并行性,用于自动异步数据传输
机译:在GPU中利用数据并行性。
机译:GLMdenoise:一种用于对基于任务的fMRI数据进行去噪的快速自动化技术
机译:SWIFT:使用基于任务的并行性,完全异步通信和基于图分区的域分解,可在100,000多个内核上进行强扩展。