首页> 外文OA文献 >Hierarchical approach for deriving a reproducible unblocked LU factorization
【2h】

Hierarchical approach for deriving a reproducible unblocked LU factorization

机译:用于导出可重复的未阻止的LU分解的分层方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

We propose a reproducible variant of the unblocked LU factorization for graphics processor units (GPUs). For this purpose, we build upon Level-1/2 BLAS kernels that deliver correctly-rounded and reproducible results for the dot (inner) product, vector scaling, and the matrix-vector product. In addition, we draw a strategy to enhance the accuracy of the triangular solve via iterative refinement. Following a bottom-up approach, we finally construct a reproducible unblocked implementation of the LU factorization for GPUs, which accommodates partial pivoting for stability and can be eventually integrated into a (blocked) high performance and stable algorithm for the LU factorization.
机译:我们提出了一种可重复的图形处理器单元(GPU)的疏通LU分解变体。为此目的,我们建立在1级-1 / 2BLAS内核上,为点(内部)产品,矢量缩放和矩阵矢量产品提供正确的圆形和可重复的结果。此外,我们通过迭代细化制定了一种策略来提高三角形解决的准确性。在自下而上的方法之后,我们最终构造了GPU的LU分解的可再生未经阻止的实现,其适应稳定性的部分枢转,并且最终可以集成到LU分解的(封锁)高性能和稳定算法中。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号