首页> 外文会议>International conference on algorithms and architectures for parallel processing >An Implementation of Parallel 2-D FFT Using Intel AVX Instructions on Multi-core Processors
【24h】

An Implementation of Parallel 2-D FFT Using Intel AVX Instructions on Multi-core Processors

机译:使用Intel AVX指令在多核处理器上并行2-D FFT的实现

获取原文

摘要

In this paper, we propose an implementation of a parallel two-dimensional fast Fourier transform (FFT) using Intel Advanced Vector Extensions (AVX) instructions on multi-core processors. The combination of vectorization and a block two-dimensional FFT algorithm is shown to effectively improve performance. We vectorized FFT kernels using the AVX instructions. Performance results of two-dimensional FFTs on multi-core processors are reported. We successfully achieved a performance of over 61 GFlops on an Intel Xeon E5-2670 (2.6 GHz, two CPUs, 16 cores) and over 24 GFlops on an Intel Core i7-3930K (3.2 GHz, one CPU, six cores) for a 2~(12) × 2~(12)-point FFT.
机译:在本文中,我们提出了在多核处理器上使用英特尔高级矢量扩展(AVX)指令实现并行二维快速傅里叶变换(FFT)的实现。显示了矢量化和块二维FFT算法的组合可以有效地提高性能。我们使用AVX指令对FFT内核进行了矢量化处理。报告了多核处理器上二维FFT的性能结果。我们成功地在Intel Xeon E5-2670(2.6 GHz,两个CPU,16个内核)上实现了61 GFlops的性能,在Intel Core i7-3930K(3.2 GHz,一个CPU,六个内核)上成功地实现了2个以上的GFlops性能。 〜(12)×2〜(12)点FFT。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号