首页> 外文OA文献 >Acceleration of tensor-product operations for high-order finite element methods
【2h】

Acceleration of tensor-product operations for high-order finite element methods

机译:加速高阶有限元方法的张量 - 产品操作

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

This paper is devoted to GPU kernel optimization and performance analysis ofthree tensor-product operators arising in finite element methods. We provide amathematical background to these operations and implementation details.Achieving close-to-the-peak performance for these operators requires extensiveoptimization because of the operators' properties: low arithmetic intensity,tiered structure, and the need to store intermediate results inside the kernel.We give a guided overview of optimization strategies and we present aperformance model that allows us to compare the efficacy of these optimizationsagainst an empirically calibrated roofline.
机译:本文致力于GPU内核优化和特性 - 产品运算符在有限元方法中产生的富集 - 产品运营商。我们为这些操作和实现详细信息提供了可执行的背景。由于运算符的属性:低算术强度,分层结构以及在内核内存储中间结果的需要,因此对这些运算符的近峰值性能需要宽松优化。我们提供了优化策略的指导概述,我们呈现了能够对我们进行比较这些优化Against的效果的特性模型,这是经验校准的屋顶线。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号