首页> 外文会议>Simulation Multi-Conference >MATRIX-FREE FINITE-ELEMENT COMPUTATIONS ON GRAPHICS PROCESSORS WITH ADAPTIVELY REFINED UNSTRUCTURED MESHES

【24h】

MATRIX-FREE FINITE-ELEMENT COMPUTATIONS ON GRAPHICS PROCESSORS WITH ADAPTIVELY REFINED UNSTRUCTURED MESHES

机译：图形处理器的无矩阵有限元计算，具有自适应地精制非结构化网格

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

This paper concerns efficient matrix-free finite-element algorithms on modern manycore processors such as graphics cards (GPUs) as an alternative to sparse matrix-vector products. In matrix-free finite element algorithms, the assembly and solution phases are merged, yielding a significantly lower memory bandwidth footprint, with a corresponding increase in efficiency on bandwidth limited processors. Additionally, no system matrix must be assembled or stored in memory. We present a GPU parallelization of the matrix-free method including a novel algorithm for resolving hanging-node constraints on the GPU, capable of simulation on adaptively refined grids. For second-order elements and higher in 3D, our GPU implementation of the adaptive algorithm is between 1.8 and 2.3 times faster than an existing optimized CPU version, on comparable hardware. Compared to a matrix-based implementation using CUSPARSE, we get a speedup of 8 and can solve problems 8 times larger in 3D.

机译：本文涉及现代多核处理器上有效的矩阵有限元算法，如显卡（GPU）作为稀疏矩阵矢量产品的替代方案。在无矩阵有限元算法中，合并组件和解决方案阶段，产生显着更低的存储带宽足迹，在带宽有限处理器上具有相应的效率提高。此外，必须在内存中组装或存储系统矩阵。我们介绍了一种GPU的PUP并行化，包括用于解决GPU上的悬挂节点约束的新型算法，能够在适自适应的格式网格上进行模拟。对于二阶元素和3D更高，我们的Adaptive算法的GPU实现比现有的硬件上的现有优化CPU版本快于1.8％至2.3倍。与使用Cusparse的基于矩阵的实现相比，我们得到了8的加速，可以解决3D较大的问题。

著录项

来源
《Simulation Multi-Conference》|2017年|188p|共12页
会议地点
作者
Karl Ljungkvist;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类 TP301-53;
关键词
Finite element methods; GPU; Matrix free; Adaptive refinement; Hanging nodes;

机译：有限元方法;GPU;矩阵自由;自适应细化;悬挂节点;

相似文献

外文文献
中文文献
专利

1. A three-stage graphics processing unit-based finite element analyses matrix generation strategy for unstructured meshes [J] . International Journal for Numerical Methods in Engineering . 2020,第17期

机译：基于三级图形处理单元的有限元分析了非结构化网格的矩阵生成策略
2. Multigrid for matrix-free high-order finite element computations on graphics processors [J] . Amos Olagunju Computing reviews . 2021,第7期

机译：用于图形处理器的免费高阶有限元计算的MultiGridrid
3. Multigrid for Matrix-Free High-Order Finite Element Computations on Graphics Processors [J] . MARTIN KRONBICHLER, KARL LJUNGKVIST ACM Transactions on Parallel Computing . 2019,第1期

机译：用于图形处理器的无矩阵高阶有限元计算的Multigrid
4. MATRIX-FREE FINITE-ELEMENT COMPUTATIONS ON GRAPHICS PROCESSORS WITH ADAPTIVELY REFINED UNSTRUCTURED MESHES [C] . Karl Ljungkvist Simulation Multi-Conference . 2017

机译：图形处理器的无矩阵有限元计算，具有自适应地精制非结构化网格
5. Scalable distributed feature tracking and remapping on adaptive unstructured meshes for finite element simulations. [D] . Permann, Cody James. 2017

机译：可扩展的分布式特征跟踪和自适应非结构化网格上的重新映射，用于有限元模拟。
6. Adaptive-optics Optical Coherence Tomography Processing Using a Graphics Processing Unit [O] . Brandon A. Shafer, Jeffery E. Kriske Jr, Omer P. Kocaoglu, -1

机译：使用图形处理单元的自适应光学相干层析成像处理
7. Topology Optimization with Unstructured Meshes on Graphics Processing Units (GPUs) [O] . Zegard Latrach Tomas 2010

机译：在图形处理单元（GpU）上使用非结构化网格进行拓扑优化
8. Toolkit to Support Parallel Adaptive Computations on Unstructured Meshes. [R] . Tourtellott, J., Tendulkar, S., Beall, M., 2003

机译：非结构化网格上支持并行自适应计算的工具包。

MATRIX-FREE FINITE-ELEMENT COMPUTATIONS ON GRAPHICS PROCESSORS WITH ADAPTIVELY REFINED UNSTRUCTURED MESHES

摘要

著录项

相似文献

相关主题

期刊订阅