【24h】

A Scalable OpenCL-Based FPGA Accelerator for YOLOv2

机译:基于可扩展的基于OpenCL的FPGA加速器,用于YOLOV2

获取原文

摘要

This paper implements an OpenCL-based FPGA accelerator for YOLOv2 on Arria-10 GX1150 FPGA board. The hardware architecture adopts a scalable pipeline design to support multi-resolution input image, and improves resource utilization by full 8-bit fixed-point computation and CONV+BN+Leaky-ReLU layer fusion technology. The proposed design achieves a peak throughput of 566 GOPs under 190 MHz working frequency. The accelerator could run YOLOv2 inference with 288×288 input resolution and tiny YOLOv2 with 416×416 input resolution at the speed of 35 and 71 FPS, respectively.
机译:本文实现了ARIA-10 GX1150 FPGA板上的YOLOV2的基于OPENCL的FPGA加速器。硬件架构采用可扩展的管道设计来支持多分辨率输入图像,并通过全8位定点计算和CONC + BN +泄漏 - Relu层融合技术提高资源利用率。所提出的设计在190 MHz工作频率下实现了566个GOP的峰值吞吐量。加速器可以分别以288×288个输入分辨率和微小的yolov2运行Yolov2推断,分别以416×416输入分辨率分别为35和71 FPS。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号