首页> 外文OA文献 >Scalable Task-Based Algorithm for Multiplication of Block-Rank-Sparse Matrices
【2h】

Scalable Task-Based Algorithm for Multiplication of Block-Rank-Sparse Matrices

机译:基于可扩展任务的块秩稀疏乘法算法   矩阵

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

A task-based formulation of Scalable Universal Matrix MultiplicationAlgorithm (SUMMA), a popular algorithm for matrix multiplication (MM), isapplied to the multiplication of hierarchy-free, rank-structured matrices thatappear in the domain of quantum chemistry (QC). The novel features of ourformulation are: (1) concurrent scheduling of multiple SUMMA iterations, and(2) fine-grained task-based composition. These features make it tolerant of theload imbalance due to the irregular matrix structure and eliminate allartifactual sources of global synchronization.Scalability of iterativecomputation of square-root inverse of block-rank-sparse QC matrices isdemonstrated; for full-rank (dense) matrices the performance of our SUMMAformulation usually exceeds that of the state-of-the-art dense MMimplementations (ScaLAPACK and Cyclops Tensor Framework).
机译:一种可扩展的通用矩阵乘法算法(SUMMA)是一种基于任务的公式表示法,是矩阵乘法(MM)的一种流行算法,适用于在量子化学(QC)领域中出现的无层次,秩结构矩阵的乘法。我们公式化的新颖特征是:(1)多个SUMMA迭代的并发调度,以及(2)基于任务的细粒度组合。这些特征使得它能够容忍由于不规则矩阵结构而导致的负载不平衡,并消除了所有人为的全局同步源。证明了块秩稀疏QC矩阵平方根逆的迭代计算的可伸缩性;对于全秩(密集)矩阵,我们的SUMMAformulation的性能通常超过最先进的密集MM实现(ScaLAPACK和Cyclops Tensor Framework)。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号