An FPGA-Based Convolutional Neural Network Coprocessor

Changpei Qiu; Xin’an Wang; Tianxia Zhao; Qiuping Li; Bo Wang; Hu Wang

首页> 外文期刊>Wireless communications & mobile computing >An FPGA-Based Convolutional Neural Network Coprocessor

【24h】

An FPGA-Based Convolutional Neural Network Coprocessor

机译：基于FPGA的卷积神经网络协处理器

获取原文

获取外文期刊封面目录资料

开具论文收录证明 >>

文献代查 >>

文献数据库（团队版） >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

In this paper, an FPGA-based convolutional neural network coprocessor is proposed. The coprocessor has a 1D convolutional computation unit PE in row stationary (RS) streaming mode and a 3D convolutional computation unit PE chain in pulsating array structure. The coprocessor can flexibly control the number of PE array openings according to the number of output channels of the convolutional layer. In this paper, we design a storage system with multilevel cache, and the global cache uses multiple broadcasts to distribute data to local caches and propose an image segmentation method that is compatible with the hardware architecture. The proposed coprocessor implements the convolutional and pooling layers of the VGG16 neural network model, in which the activation value, weight value, and bias value are quantized using 16-bit fixed-point quantization, with a peak computational performance of 316.0 GOP/s and an average computational performance of 62.54 GOP/s at a clock frequency of 200?MHz and a power consumption of about 9.25?W.

机译：本文提出了一种基于FPGA的卷积神经网络协处理器。协处理器具有由行静止（RS）流模式的1D卷积计算单元PE和脉动阵列结构中的3D卷积计算单元PE链。根据卷积层的输出通道的数量，协处理器可以灵活地控制PE阵列开口的数量。在本文中，我们设计具有多级缓存的存储系统，全局高速缓存使用多个广播将数据分发到本地高速缓存，并提出与硬件架构兼容的图像分段方法。所提出的协处理器实现了VGG16神经网络模型的卷积和汇集层，其中使用16位定点量化量化激活值，权重值和偏置值，峰值计算性能为316.0 GOP / S和平均计算性能为62.54 GOP / S，时钟频率为200？MHz，功耗为约9.25倍。

著录项

来源
《Wireless communications & mobile computing》 |2021年第a期|共12页
作者
Changpei Qiu; Xin’an Wang; Tianxia Zhao; Qiuping Li; Bo Wang; Hu Wang;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种
中图分类无线通信;
关键词

相似文献

外文文献
中文文献
专利

1. FFConv: An FPGA-based Accelerator for Fast Convolution Layers in Convolutional Neural Networks [J] . AFZAL AHMAD, MUHAMMAD ADEEL PASHA ACM Transactions on Embedded Computing Systems . 2020,第2期

机译：FFCONV：卷积神经网络中的快速卷积层的基于FPGA的加速器
2. An energy-efficient deep convolutional neural networks coprocessor for multi-object detection [J] . Wu Yuancong, Wang J. J., Qian Kun, Microelectronics journal . 2020,第Apra期

机译：节能深度卷积神经网络协处理器用于多目标检测
3. A Dynamically Configurable Coprocessor for Convolutional Neural Networks [J] . Srimat Chakradhar, Murugan Sankaradas, Venkata Jakkula, Computer architecture news . 2010,第3期

机译：卷积神经网络的动态可配置协处理器
4. An efficient implementation of deep convolutional neural networks on a mobile coprocessor [C] . Jin Jonghoon, Gokhale Vinayak, Dundar Aysegul, IEEE International Midwest Symposium on Circuits and Systems . 2014

机译：在移动协处理器上深度卷积神经网络的有效实现
5. FPGA-based Accelerators for Convolutional Neural Networks on Embedded Devices [D] . Perera Miro, Jordi. 2020

机译：基于FPGA的嵌入式设备卷积神经网络的加速器
6. 3D Convolutional Neural Networks Initialized from Pretrained 2D Convolutional Neural Networks for Classification of Industrial Parts [O] . Ibon Merino, Jon Azpiazu, Anthony Remazeilles, 2021

机译：3D卷积神经网络从佩带的2D卷积神经网络初始化用于工业部件的分类
7. Latency-Driven Design for FPGA-based Convolutional Neural Networks [O] . Bouganis, C, Venieris 2017

机译：基于FpGa的卷积神经网络的延迟驱动设计

An FPGA-Based Convolutional Neural Network Coprocessor

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅