CNN卷积计算在移动GPU上的加速研究

王湘新; 时洋; 文梅

首页> 中文期刊> 《计算机工程与科学》 >CNN卷积计算在移动GPU上的加速研究

CNN卷积计算在移动GPU上的加速研究

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

Convolutional Neural Networks (CNNs) are playing an increasingly important role in areas such as image classification and speech recognition because of their excellent performance.Some researchers have already wanted to apply this deep learning process on mobile phones,but the performance of the porting program is unsatisfactory due to the huge amount of computation of CNN.In order to explore how to solve this problem,this paper uses a deep learning framework named MXNet to realize the forward process of CNN on mobile phones and focuses on the use of GPU that is another powerful computing device on the mobile phone.Based on the OpenCL common programming framework,we use matrix multiplication to compute the most time-consuming convolution in the forward process and move it to the GPU.Besides,serval improvements are made to achieve better performance.Finally,the experimental results show that we succeed in reducing the time of the forward process to half of the original time.%卷积神经网络(CNN)凭借其优秀的表现正在诸如图像分类、语音识别等领域里扮演着越来越重要的角色,已经有一些研究人员想要将这个深度学习过程复制到手机上.但是,由于CNN巨大的计算量,移植程序的性能一直难以令人满意.为了探讨如何解决这一问题,借助MXNet这样一个深度学习的框架在手机上实现了CNN的前向过程,并且将注意力放在了使用手机上另一个强大的计算设备——GPU上.最终选择使用OpenCL通用编程框架将前向过程中最耗时的卷积操作利用矩阵乘来完成,并转移到GPU上进行.在此基础之上还针对手机GPU做了一些优化.最终,实验结果显示我们成功地将前向过程的时间降低到了原来时间的一半.

著录项

来源
《计算机工程与科学》 |2018年第1期|34-39|共6页
作者
王湘新; 时洋; 文梅;
展开▼
作者单位

武警湖南省消防总队信息中心;

湖南长沙410205;

国防科技大学计算机学院;

湖南长沙410073;

国防科技大学计算机学院;

湖南长沙410073;

展开▼
原文格式 PDF
正文语种 chi
中图分类模式识别与装置;
关键词
CNN; 手机; 移动GPU; 快速算法; OpenCL;

相似文献

中文文献
外文文献
专利

1. 二维卷积计算在CUDAGPU架构上的性能优化研究 [J] . 马龙飞 . 电子世界 . 2018,第002期
2. 基于GPU的筒串卷积剂量计算在肿瘤放射TPS中的应用性能研究 [J] . 王洵 ,郑传城 ,商海焦 . 医疗卫生装备 . 2016,第012期
3. GPU并行计算在LSSVM股票预测上的研究与应用 [J] . 郑晓薇 ,侯立斐 ,于梦玲 . 计算机应用与软件 . 2013,第001期
4. 卷积神经网络CNN算法在文本分类上的应用研究 [J] . 侯小培 ,高迎 . 微计算机信息 . 2019,第004期
5. 卷积神经网络CNN算法在文本分类上的应用研究 [J] . 侯小培1 ,高迎1 . 科技与创新 . 2019,第004期
6. 一种基于卷积神经网络的移动GPU物体检测系统 [C] . Cheng Wang ,王程 ,Ying Wang . 第十七届全国容错计算学术会议 . -1
7. 适用于CNN的高能效可配置卷积加速器的设计与实现 [A] . 徐明 . 2019

CNN卷积计算在移动GPU上的加速研究

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅