机译:GPU上的循环约简对角线求解器应用于混合精度多网格
GPU Computing; NVIDIA CUDA.; cyclic reduction; finite elements; mixed-precision iterative refinement; multigrid; tridiagonal solvers;
机译:具有块循环归约求解器的不连续Galerkin方法,用于在GPU上模拟可压缩流
机译:通过分块循环约简和单GPU共享内存有效解决三对角线系统
机译:用于高阶可压缩粘性流模拟的循环归约求解器的高效GPU实现
机译:研究使用FP16的混合精度求解器对使用GPU的对称正定矩阵的好处
机译:通过应用性能建模提高代数多网格求解器的性能和可伸缩性。
机译:非周期性的高效收敛SENSE MRI重建通过对角线解算器的边界条件
机译:GpU上的循环缩减三对角求解器应用于混合精度多重网格
机译:多重网格和循环约简应用于亥姆霍兹方程