首页> 中文会议>2017电力行业信息化年会 >基于FPGA的CNN单机多卡加速算法实现

基于FPGA的CNN单机多卡加速算法实现

摘要

随着互联网图像和视频等可视数据的爆发式增长,找到有效的图像排序、分类和识别方法变得至关重要.卷积神经网络(CNN)是一种基于人脑功能的机器学习方法,通常用于图像分析.目前研究除利用高性能计算(HPC)器件(如GPU)对CNN进行硬件加速外,也采用了CPU+FPGA异构加速平台对CNN进行硬件加速,并取得了很好的效果.基于此研究,提出一种单机多卡的硬件结构,从而进一步提高FPGA加速CNN线上识别任务的效率.通过在单个服务器上配置多块FPGA加速卡,利用多块FPGA加速卡并行机制,对海量数据同时处理,从而进一步提高CNN算法性能.实验表明,提出的基于FPGA的一机多卡架构能够线性提高CNN算法的实现速率.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号