...
首页> 外文期刊>Parallel Processing Letters >Parallel Implementation of Fast Randomized Algorithms for Low Rank Matrix Decomposition
【24h】

Parallel Implementation of Fast Randomized Algorithms for Low Rank Matrix Decomposition

机译:低秩矩阵分解的快速随机算法的并行实现

获取原文
获取原文并翻译 | 示例

摘要

We analyze the parallel performance of randomized interpolative decomposition by decomposing low rank complex-valued Gaussian random matrices of about 100 GB. We chose a Cray XMT supercomputer as it provides an almost ideal PRAM model permitting quick investigation of parallel algorithms without obfuscation from hardware idiosyncrasies. We obtain that on non-square matrices performance scales almost linearly with runtime about 100 times faster on 128 processors. We also verify that numerically discovered error bounds still hold on matrices two orders of magnitude larger than those previously tested.
机译:我们通过分解约100 GB的低秩复数值高斯随机矩阵来分析随机插值分解的并行性能。我们选择了Cray XMT超级计算机,因为它提供了几乎理想的PRAM模型,可以快速研究并行算法,而不会因硬件特质而产生混淆。我们发现,在非平方矩阵上,性能几乎与128个处理器上的运行时间呈线性关系,运行时间快约100倍。我们还验证了在数值上发现的误差范围仍然在比先前测试的误差范围大两个数量级的矩阵上仍然有效。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号