基于FPGA的深度学习异构计算系统设计与研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来，深度学习在行业中的各个领域得到了广泛的应用，人工智能技术的进步大大推动了计算机视觉和语音识别等技术的发展。深度学习的研究与发展离不开强大计算能力的支撑，如何满足日益增加的算力需求成了当前研究的热门问题，异构计算以其优异的性能和灵活的结构成为提高计算能力的主流方向。然而，针对复杂的神经网络，要进行大量数据的吞吐运算，从算法到0硬件结构都需要大量的优化。　　高性能低功耗的FPGA平台解决了需要高度并行硬件结构的问题，本文分别基于OpenCL与ZYNQ异构计算框架，对比分析了片内异构与片间异构计算的特点，提出了一种基于FPGA的异构计算优化与实现方法。在该方法中，需要将计算任务划分并将相同操作的代码段分配给同一个子任务，根据子任务的要求，在FPGA中开发了一个可复用、可配置的加速内核，使其具有较高的复用率和灵活性。高度并行化的内核设计挖掘硬件的计算能力，通过内核间的流水线设计增加系统运算吞吐量。此外，通过优化内存访问和接口通信，提高了内核的性能和能耗表现。与传统的异构计算平台相比，它拥有灵活的结构与出色的能耗比，在不影响分类精度的情况下，可用于小型的嵌入式设备。　　本文分别在DE5-NetFPGADevelopmentKit和ZynqXC7z035ffg676开发板上验证该实现方法。结合硬件资源、带宽与功耗等参数搭建理论模型，由此得出神经网络在设备上的峰值浮点运算速度。基于该方法的卷积神经网络的实验结果表明，识别图像只需1.1ms，功率为2.5W，与使用相同功耗的ARM的运行效率相比，基于异构平台的卷积运算速度快46.8倍。

著录项

作者
羌浩南;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科集成电路工程
授予学位硕士
导师姓名邹艳红,胡兴艺;
年度 2020
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
深度学习,异构计算,硬件加速,低功耗,神经网络,内核复用;

相似文献

中文文献
外文文献
专利

1. 基于深度学习的云计算系统异常检测方法 [J] . 任明 ,宋云奎 . 计算机技术与发展 . 2019,第005期
2. 基于异构计算系统的任务分配与调度算法 [J] . 马义忠 ,张聪 ,周立文 . 甘肃科学学报 . 2005,第003期
3. 异构计算系统中基于遗传算法的任务分配与调度 [J] . 张聪 ,马义忠 . 微电子学与计算机 . 2004,第6期
4. 基于FPGA的稠密光流计算系统 [J] . 马骏 ,柴志雷 ,王芝斌 . 计算机工程与应用 . 2016,第003期
5. 基于FPGA的轮廓提取并行计算系统研究及实现 [J] . 邵兴龙 ,柴志雷 ,张圆蒲 . 计算机工程与应用 . 2015,第023期
6. 基于遗传算法的异构计算系统任务调度 [C] . 罗香玉 ,汪芸 . 2007中国计算机大会 . 2007
7. 基于CPU-GPU-FPGA的异构计算系统及任务调度算法研究 [A] . 叶盛 . 2019

基于FPGA的深度学习异构计算系统设计与研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅