首页> 中文期刊> 《计算机技术与发展》 >一种基于Zynq的CNN加速器设计与实现

一种基于Zynq的CNN加速器设计与实现

     

摘要

卷积神经网络是一种前馈神经网络,它的人工神经元可以响应部分覆盖范围内的临近单元,对于大型图像处理有出色表现.文中设计了一种基于Zynq芯片的CNN加速器,以期在资源和功耗受限的FPGA中实现运算性能加速.该加速器采用数据量化的方式将网络参数从64位双精度浮点数转化为16位定点数;针对CNN不同层的特性和要求,设计了不同的网络结构和优化策略.卷积层和全连接层采用循环分块、循环流水及循环展开等方法进一步改进,而池化层采用流水线的优化方式.亦设计了FPGA和外部存储器的缓存策略,减少FPGA和外部存储器的数据传输量.以CIFAR-10数据集下的图像识别为例,在Zynq7020实验平台上进行板级测试,实验结果表明,100 MHz的工作频率下,平均识别时间为15.5 ms,相对于单核CPU方案实现了144倍的加速.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号