首页> 外文OA文献 >Harnessing CUDA dynamic parallelism for the solution of sparse linear systems
【2h】

Harnessing CUDA dynamic parallelism for the solution of sparse linear systems

机译:利用CUDA动态并行性解决稀疏线性系统的问题

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

We leverage CUDA dynamic parallelism to reduce execution time while significantly reducing energy consumption of the Conjugate Gradient (CG) method for the iterative solution of sparse linear systems on graphics processing units (GPUs). Our new implementation of this solver is launched from the CPU in the form of a single “parent” CUDA kernel, which invokes other “child” CUDA kernels. The CPU can then continue with other work while the execution of the solver proceeds asynchronously on the GPU, or block until the execution is completed. Our experiments on a server equipped with an Intel Core i7-3770K CPU and an NVIDIA “Kepler” K20c GPU illustrate the benefits of the new CG solver.
机译:我们利用CUDA动态并行性来减少执行时间,同时显着减少共轭梯度(CG)方法在图形处理单元(GPU)上的稀疏线性系统的迭代解决方案的能耗。我们以单个“父” CUDA内核的形式从CPU启动了此求解器的新实现,该内核调用了其他“子” CUDA内核。然后,在求解器的执行在GPU上异步进行时,CPU可以继续其他工作,或者阻塞直到执行完成为止。我们在配备Intel Core i7-3770K CPU和NVIDIA“ Kepler” K20c GPU的服务器上进行的实验证明了新型CG解算器的优势。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号