【24h】

Three Algorithms for Cholesky Factorization on Distributed Memory Using Packed Storage

机译:使用打包存储对分布式内存进行Cholesky分解的三种算法

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

We present three algorithms for Cholesky factorization using minimum block storage for a distributed memory (DM) environment. One of the distributed square block packed (SBP) format algorithms performs similar to ScaLAPACK PDPOTRF, and our algorithm with iteration overlapping typically outperforms it by 15-50% for small and medium sized matrices. By storing the blocks contiguously, we get better performing BLAS operations. Our DM algorithms are not sensitive to cache conflicts and thus give smooth and predictable performance. We also investigate the intricacies of using rectangular full packed (RFP) format with ScaLAPACK routines and point out some advantages and drawbacks.
机译:我们介绍了三种Cholesky因式分解算法,这些算法使用的最小块存储用于分布式内存(DM)环境。一种分布式正方形块打包(SBP)格式算法的性能与ScaLAPACK PDPOTRF相似,而我们的算法具有迭代重叠功能,对于中小型矩阵,其性能通常要比其高出15-50%。通过连续存储块,我们可以更好地执行BLAS操作。我们的DM算法对缓存冲突不敏感,因此可以提供平稳且可预测的性能。我们还研究了使用ScaLAPACK例程使用矩形完全打包(RFP)格式的复杂性,并指出了一些优点和缺点。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号