机译:通过内核融合在GPU上加速显式ODE方法
University of Bayreuth, Department of Computer Science, Universitätsstraße 30, 95447 Bayreuth, Germany;
University of Bayreuth, Department of Computer Science, Universitätsstraße 30, 95447 Bayreuth, Germany;
CUDA; explicit methods; GPU; initial value problems; kernel fusion; locality; numerical integration; OpenCL; ordinary differential equations; parallel; peer methods; PIRK methods; Runge–Kutta methods; scalability;
机译:深入引入Multi-Workgroup Tiling,用于改进具有有限访问GPUS访问距离的ode系统的显式单步机的局域网
机译:使用GPU和混合显式/隐式ODE集成来加速多维燃烧模拟
机译:加速工业应用:针对新块AMG算法的基本GPU内核的开发,该算法可通过显式计算的稀疏基础解决SLE
机译:在GPU的显式一站式方法的各个阶段利用有限的访问距离进行内核融合
机译:通过使用带有CUDA的多个GPU来加速不连续的Galerkin方法和有限差分方法。
机译:GpU加速前进和后退预测与空间变异性为内核DIRECT 3D TOF pET重建
机译:加速工业应用:针对新块AMG算法的基本GPU内核的开发,该算法可通过显式计算的稀疏基础解决SLE
机译:大气化学中硬度ODE的显式方法