【24h】

Efficient Two-Level Preconditioned Conjugate Gradient Method on the GPU

机译:GPU上有效的两级预先配置的共轭梯度方法

获取原文

摘要

We present an implementation of a Two-Level Preconditioned Conjugate Gradient Method for the GPU. We investigate a Truncated Neumann Series based preconditioner in combination with deflation. This combination exhibits fine-grain parallelism and hence we gain considerably in execution time when compared with a similar implementation on the CPU. Its numerical performance is comparable to the Block Incomplete Cholesky approach. Our method provides a speedup of up to 16 for a system of one million unknowns when compared to an optimized implementation on one core of the CPU.
机译:我们介绍了用于GPU的两级预处理共轭梯度方法的实现。我们研究基于截断的基于Neumann系列的预处理器与通货紧缩组合。这种组合呈现细颗粒并行性,因此在与CPU上的类似实现相比时,我们在执行时间内得到了大幅度。其数值性能与块不完全凿孔的方法相当。与CPU的一个核心上的优化实现相比,我们的方法提供了100万未知的系统最多16的加速。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号