首页> 外文期刊>電子情報通信学会技術研究報告 >リコンフィギャラブルマシンSRC-6におけるDMA転送の最適化手法
【24h】

リコンフィギャラブルマシンSRC-6におけるDMA転送の最適化手法

机译:可重构机器SRC-6上DMA传输的优化方法

获取原文
获取原文并翻译 | 示例
       

摘要

リコンフィギャラブルマシンでは,CPU とFPGA 間のデータ転送がボトルネックになることが多く,転送時間の短縮が求められている.このためSRC-6のDMA転送は複数のオンボードメモリにインタリーブしながらストリーミング処理することが可能となっている.しかし,FPGAの資源制約が大きなアプリケーションでは,インタリーブの前処理としてCPU上でのデータ並べ換えを行う必要がある.本稿では,そのオーバーヘッドを評価し,トレードオフポイントを明らかにした.その結果,1データ列あたリ150KB以下の演算を扱う場合,CPU上で並べ換えをした後インタリープしながらストリーミング処理を行うことで速度向上が実現できることを示した.%DMA transfer between a CPU and an FPGA often becomes a bottleneck of current reconfigurable machines. To mitigate this problem, the DMA transfer of SRC-6 supports streaming processing with a on-board memory interleave. However, as a preprocessing of the interleave, the CPU must reorder the data for applications with severe FPGA resource constraints. This paper empirically evaluates this overhead to reveal the trade-off point. The results show that the speedup is achieved by interleaved streaming DMA when FPGAs treat 150 KB or lower of data per stream.
机译:在可重配置机器中,CPU和FPGA之间的数据传输经常成为瓶颈,因此有必要减少传输时间。因此,可以在将SRC-6的DMA传输交织到多个板载存储器的同时执行流处理。但是,对于具有较大FPGA资源限制的应用程序,有必要在CPU上执行数据重排,作为用于交织的预处理。在本文中,我们评估了开销并澄清了折衷点。结果表明,当处理每个数据串小于150 KB的操作时,通过在重新排列CPU之后进行交织同时执行流处理,可以实现速度提高。 CPU和FPGA之间的DMA传输百分比通常会成为当前可重配置机器的瓶颈。为缓解此问题,SRC-6的DMA传输支持使用板载内存交错的流处理。但是,作为交错的预处理, CPU必须为具有严重FPGA资源限制的应用程序重新排序数据。本文通过经验评估此开销以揭示折衷点。结果表明,当FPGA处理150 KB或更低的数据时,交错式流DMA可以提高速度流。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号