一种基于FPGA的卷积神经网络加速器设计与实现

仇越; 马文涛; 柴志雷

首页> 中文期刊>微电子学与计算机 >一种基于FPGA的卷积神经网络加速器设计与实现

一种基于FPGA的卷积神经网络加速器设计与实现

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对卷积神经网络模型ZynqNet现有FPGA实现版本中卷积运算单元并行度低,存储结构过度依赖片外存储等问题,提出一种针对ZynqNet的FPGA优化设计.设计了双缓冲结构将中间运算结果放到片内以减少片外存储访问;将数据位宽从32位降为16位;设计了具有64个卷积运算单元的并行结构.实验结果表明,在ImageNet测试准确度相同的情况下,本文所提出的设计工作频率可达200 MHz,运算速率峰值达到1.85GMAC/s,是原ZynqNet实现的10倍,相比i5-5200UCPU可实现20倍加速.同时,其计算能效达到了NVIDIA GTX 970GPU的5.4倍.

著录项

来源
《微电子学与计算机》|2018年第8期|68-72|共6页
作者
仇越; 马文涛; 柴志雷;
展开▼
作者单位

江南大学物联网工程学院;

数学工程与先进计算国家重点实验室;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算机的应用;
关键词
卷积神经网络; 现场可编程门阵列(FPGA); ZynqNet; 并行计算; 加速;
入库时间 2022-08-20 22:35:40

相似文献

中文文献
外文文献
专利

1. 一种基于FPGA的卷积神经网络加速器的设计与实现 [J] . 张榜 ,来金梅 . 复旦学报：自然科学版 . 2018,第2期
2. 基于FPGA的卷积神经网络加速器设计与实现 [J] . 魏浚峰 ,王东 ,山丹 . 中国集成电路 . 2019,第007期
3. 基于FPGA的卷积神经网络并行加速器设计 [J] . 王婷 ,陈斌岳 ,张福海 . 电子技术应用 . 2021,第002期
4. 基于FPGA的卷积神经网络训练加速器设计 [J] . 孟浩 ,刘强 . 南京大学学报:自然科学版 . 2021,第6期
5. 基于FPGA的卷积神经网络硬件加速器设计空间探索研究 [J] . 郭谦 ,贺光辉 . 微电子学与计算机 . 2020,第8期
6. 基于Winograd算法的卷积神经网络FPGA加速器的设计方法 [C] . Wang Aobo ,王奥博 ,Liu Kai . 2018年全国高性能计算学术年会 . 2018
7. 基于FPGA的可重构卷积神经网络加速器的设计与实现 [A] . 陈淘生 . 2021

一种基于FPGA的卷积神经网络加速器设计与实现

摘要

著录项

相似文献

相关主题

期刊订阅