深度学习中的卷积神经网络硬件加速系统设计研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近几年来伴随着深度学习所带来的新的机器学习热潮，深度神经网络已经广泛的应用于图像识别、图像分类、目标检测和自然语言处理等不同的大规模机器学习问题当中，并且已经取得了一系列突破性的实验结果与实际应用，如今深度学习其强大的特征学习能力与识别分类能力被广泛的研究与关注。但由于深度学习中的卷积神经网络模型通常具有深度高、层次复杂、数量级大、并行度高、计算和存储密集的特征，从而使得大量的卷积计算操作和池化计算操作在具体应用中成为巨大的瓶颈，并且大量层间计算结果的存储对于计算机的存储结构也提出了较高的要求，使其在实时的应用场景下面临着巨大的挑战。现场可编程阵列FPGA（Field-Programmable Gate Array），是一种电路密集度大的运算加速器件，它集成了丰富的内部存储硬件资源、灵活的可编程逻辑资源以及高性能的计算资源，能够充分发挥卷积神经网络结构并行特性，并且能够在尺寸要求小、功耗限制低情况下实现卷积神经网络的高速运算，是实现卷积神经网络运算的理想平台。本论文主要针对深度学习中的图像识别任务进行了硬件加速系统设计研究。文章主要根据卷积神经网络的结构特点，在基于ZYNQ系列芯片的FPGA上将卷积神经网络进行了硬化实现，利用FPGA的并行计算特性与流水线技术减少了卷积神经网络的计算时间，从而实现了卷积神经网络的硬件加速；同时为了满足实时场景下对图像识别的应用需求，本文设计出了一种实时识别硬件系统框架，采用软硬件协同的方式，使用ZYNQ系列芯片的ARM完成对输入图像数据的实时采集、存储和显示，将采集存储的数据通过AXI4总线传输至FPGA中硬化后的卷积神经网络来完成对图像的实时识别，并且该系统框架还可以替换不同的硬化卷积神经网络模型，满足多场景下的实时识别任务需求。实验结果表明，本文设计的硬化卷积神经网络模型能够在单个时钟周期内完成528次卷积运算，相较于通用C P U的计算效率得到了显著提升；在对权值参数进行11位定点量化后网络的识别率为97.8%，具有较高的准确率；并且本文设计出的实时识别硬件系统框架能够实现对摄像头采集图像的实时识别，同时结合ZYNQ器件中高度模块化设计使得整个系统框架具有移植性高的特性，且系统整体运行时所需的功耗低。

著录项

作者
王昆;
展开▼
作者单位

贵州大学;

展开▼
授予单位贵州大学;
学科电路与系统
授予学位硕士
导师姓名周骅;
年度 2019
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;基本电子电路;
关键词
深度学习; 卷积; 神经; 网络硬件; 加速系统;
入库时间 2022-08-17 10:27:56

相似文献

中文文献
外文文献
专利

1. 深度学习中的卷积神经网络系统设计及硬件实现 [J] . 王昆 ,周骅 . 电子技术应用 . 2018,第005期
2. 深度学习中卷积神经网络的结构及相关算法 [J] . 王统 . 信息与电脑 . 2020,第008期
3. 基于深度学习的卷积神经网络在民族图案语义标签中的应用研究 [J] . 曾凡菊 ,谭永前 . 信息与电脑 . 2019,第019期
4. 基于深度学习的卷积神经网络在图像风格化处理中的应用研究 [J] . 谭永前 ,曾凡菊 . 信息与电脑 . 2019,第019期
5. 深度学习算法中卷积神经网络的概念综述 [J] . 李策 ,陈海霞 ,汉语 . 电子测试 . 2018,第023期
6. 面向深度学习硬件加速器的网络编译工具设计 [C] . YAN Tianwei ,严天炜 ,ZHANG Zhixin . 第十四届全国信号和智能信息处理与应用学术会议 . 2021
7. 基于FPGA的卷积神经网络硬件加速器设计研究 [A] . 李炳剑 . 2019

深度学习中的卷积神经网络硬件加速系统设计研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅