首页> 外文OA文献 >積和演算命令に向いた8基底FFTカーネルの提案
【2h】

積和演算命令に向いた8基底FFTカーネルの提案

机译:适用于乘法累加运算指令的8基FFT内核的建议

摘要

本論文では,積和演算命令に向いた8基底FFTカーネルを提案する.この8基底FFTカーネルは積和演算命令を持つプロセッサにおいて,従来の8基底FFTカーネルに比べて総演算命令数を削減する.提案した8基底FFTカーネルを,積和演算命令を持つプロセッサを搭載したワークステーションIBM RS/6000 590および共有メモリ型ベクトル並列計算機NEC SX-4に実現し,性能評価を行った.その結果,従来の8基底FFTカーネルや,Goedeckerによる積和演算命令に向いた4基底FFTカーネルに比べても高い性能が得られた."In this paper, we propose a new radix-8 fast Fourier transform (FFT)kernel suitable for the CPU with multiply-add instruction.The proposed radix-8 FFT kernel requires less floating-pointinstructions than does the conventional radix-8 FFT kernel onprocessors which have a multiply-add instruction.We implement this algorithm and evaluate its performance on the IBMRS/6000 590 workstation and NEC SX-4 shared-memory vector parallelcomputer both of which have a multiply-add instruction.The result shows that our radix-8 FFT kernel is faster than theconventional radix-8 FFT kernel or Goedeckeru27s radix-4 FFT kernel.
机译:在本文中,我们提出了一种适用于乘法累加运算指令的8基FFT内核。与具有乘法累加计算指令的处理器中的传统8基FFT内核相比,此8基FFT内核减少了计算指令的总数。我们在配备有带乘法累加操作指令的处理器和共享内存矢量并行计算机NEC SX-4的工作站IBM RS / 6000 590上实现了建议的基于8位FFT的内核,并对其性能进行了评估。结果,即使与传统的8基FFT内核和适用于Goedecker乘法累加指令的4基FFT内核相比,也可以获得高性能。 “在本文中,我们提出了一种适用于具有乘法加法指令的CPU的新的radix-8快速傅立叶变换(FFT)内核。与传统的radix-8 FFT内核相比,所提出的radix-8 FFT内核所需的浮点指令更少在具有乘法加法指令的工具上,我们实现了该算法并在IBMRS / 6000 590工作站和NEC SX-4共享内存向量并行计算机上评估了它们的性能,这两个计算机都有乘法加法指令,结果表明我们的基数-8 FFT内核比常规的radix-8 FFT内核或Goedecker radix-4 FFT内核快。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号