首页> 外文期刊>電子情報通信学会技術研究報告 >アンテナ設計のためのFDTD法による電磁界シミュレーションのGPUへの実装
【24h】

アンテナ設計のためのFDTD法による電磁界シミュレーションのGPUへの実装

机译:基于FDTD的电磁场仿真在GPU天线设计中的实现

获取原文
获取原文并翻译 | 示例
       

摘要

本稿は,アンテナ設計のための,3次元FDTD法による電磁界シミュレーションのGPUを用いた高速化について述べる.境界条件としてBerengerによって提案されたsplit PMLを用いた3D-FDTD法は,ステンシル演算の一種であリGPUでの高速化に通していると考えられる.計算領域をブロック化する際にはGPUの構造を考慮したいくつかのブロック化サイズが考えられるが,複数のサイズで評価を行い最適なサイズを明らかにする.さらに,わずかなメモリ使用量の増加と引換に約12%の性能向上が見られるカーネルの統合について述べる.GeForce GTX295を用いた評価の結果,最適なブロック化サイズの探索とカーネルの統合などの最適化により,Corei7920上のシンプルな実装に対して約110倍の高速化が達成され,マルチコアやSIMD命令の理想的な活用を想定しても約3.45倍の高速化が期待できることが分かった.%This paper describes electromagnetical field simulation using the 3D-FDTD method for antenna designing on a CUDA-compatible GPU. We used the split Perfectly Matched Layer as absorbing boundary condition. As is well known, the 3D-FDTD method is a kind of stencil computation and is considered better at GPU implementation. In order to find the best blocking size for the target GPU architecture, we empirically explored a design space of blocking size. We also propose a kernel join method as one of efficient optimization methods, which improves the total performance about 12% at the cost of a small increase in memory usage. As a result of evaluation, our implementation of the 3D-FDTD method on a GeForce GTX295 platform achieves about 110 times performance improvement compared to a simple CPU implementation, which is estimated about 3.45 times faster than an ideally parallelized CPU implementation using multi-core and SIMD instructions.
机译:本文介绍了使用GPU进行3D FDTD方法加速电磁场仿真的天线设计,以Berenger提出的以分裂PML为边界条件的3D-FDTD方法是一种模板操作。但是,在阻塞计算区域时,考虑到GPU结构时,已经考虑了一些块大小,但是最好使用多个大小进行评估。另外,我们描述了内核的集成,该性能显示出大约12%的性能提升,而内存使用量却略有增加;使用GeForce GTX295的评估结果表明,正在寻找最佳的块大小。通过优化内核和内核的集成,速度比Core i7920上的简单实现快110倍,即使假设理想地使用多核和SIMD指令,速度也快约3.45倍。 %本文介绍了使用3D-FDTD方法在CUDA兼容GPU上进行天线设计的电磁场仿真,我们使用分离的完全匹配层作为吸收边界条件。该方法是一种模版计算,在GPU实现中被认为是更好的方法。为了找到目标GPU架构的最佳块大小,我们经验性地探索了块大小的设计空间。我们还提出了一种内核连接方法作为一种有效的方法。优化方法,以sm的代价将总体性能提高了约12%所有内存使用量均增加。作为评估的结果,我们在GeForce GTX295平台上实现3D-FDTD方法的性能比简单的CPU实现约110倍的性能提升,估计比理想的并行化CPU快约3.45倍。使用多核和SIMD指令实现。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号