首页> 外文会议>International Workshop on Computational Engineering >Portable Node-Level Performance Optimization for the Fast Multipole Method
【24h】

Portable Node-Level Performance Optimization for the Fast Multipole Method

机译:快速多极方法的便携式节点级性能优化

获取原文

摘要

This article provides an in-depth analysis and high-level C++ optimization strategies for the most time-consuming kernels of a Fast Multipole Method (FMM). The two main kernels of a Coulomb FMM are formulated to support different hardware features, such as unrolling, vectorization or threading without the need to rewrite the kernels in intrinsics or even assembly. The abstract description of the algorithm automatically allows optimal node-level peak performance on a broad class of available hardware platforms. Most of the presented optimization schemes allow a generic, hence platform-independent description for other kernels as well.
机译:本文提供了深入的分析和高级C ++优化策略,用于快速多极方法(FMM)的最耗时的核心。配方化库仑FMM的两个主内核以支持不同的硬件功能,例如展开,矢量化或穿线,而无需重写内在甚至组装中的内核。算法的抽象描述自动允许在广泛的可用硬件平台上最佳节点级峰值性能。大多数所呈现的优化方案允许通用,因此对其他内核的平台无关的描述。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号