基于多GPU的多层神经网络并行加速训练算法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

神经网络在刚刚起步之初，由于硬件发展水平的限制，主要使用CPU或其集群训练模型。而对于目前深度学习中需要密集计算的多层神经网络而言，在传统的CPU环境中的训练时间成本较高，因此硬件的计算资源成为网络训练的瓶颈，耗时严重是影响实验效率的关键问题。
　　如今GPU是拥有大量运算单元的通用计算设备，使用其进行神经网络的训练成为一种必然趋势。与在CPU上传统低效的串行训练过程不同，在GPU上的训练过程需要充分利用硬件计算资源和挖掘网络模型的并行性。如何在多GPU的环境中分摊训练数据集以及实时传递更新网络参数以及梯度是本课题的主要研究内容和工作。
　　本课题致力于基于多GPU的多层神经网络并行加速训练算法的研究。在对多层神经网络有监督学习过程做了深入的分析后，根据网络模型的并行结构和学习方式，设计了以小批量数据集并行前馈传播和误差反向传播的方法完成单GPU在CUDA平台上的模型并行和数据并行。详细研究和分析了传统的异步随机梯度下降算法中影响训练速度的临界资源问题，提出三处改进，首先在参数服务器中增加模型参数副本，其次设计小批量数据集的分发机制，然后设置一个独立的梯度分发线程完成GPU与参数服务器之间梯度的调度。系统在多GPU上实现改进后的异步随机梯度下降算法，实现了在多个模型副本上的数据并行。实验对比分析阶段，以网络训练时间为基准，对比在单GPU和CPU上的实现相同网络结构训练的实验效果。与当前流行的DMLC深度学习框架的训练效果进行比较，系统表现出了显著的加速效果。在多GPU上，对比分析当分别设置不同大小的批量数据以及不同GPU个数训练时达到的加速效果，并通过算法改进前后的对比实验验证了改进的异步随机梯度下降算法的有效性。

著录项

作者
毕占甲;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算机科学与技术
授予学位硕士
导师姓名王鸿鹏;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;
关键词
图形处理器; 多层神经网络; 并行加速; 误差反向传播算法; 异步随机梯度下降算法;
入库时间 2022-08-17 10:36:58

相似文献

中文文献
外文文献
专利

1. 基于GPU的并行置信传播算法优化加速研究 [J] . 孙诗慧 ,侯骏腾 ,王海平 . 现代计算机（专业版） . 2021,第022期
2. 基于IntelMIC协处理器的PIC粒子模拟并行化r加速及与CPU/GPU对比研究 [J] . 罗跃剑 ,陈哲 ,唐荣欣 . 中国科技论文 . 2018,第008期
3. 基于Intel MIC协处理器的PIC粒子模拟并行化加速及与CPU/GPU对比研究 [J] . 罗跃剑 ,陈哲 ,唐荣欣 . 中国科技论文 . 2018,第08)期
4. 基于GPU加速的并行蚁群算法求解旅行商问题研究 [J] . 杨雅宁 ,蔺勇 . 电脑知识与技术 . 2016,第012期
5. 基于GPU的并行加速渲染算法的研究 [J] . 张晓芬 ,薛国新 ,陆柯彤 . 计算机测量与控制 . 2016,第010期
6. 基于GPU加速和非负矩阵分解的并行协同过滤推荐算法 [C] . KANG Linyao ,康林瑶 ,TANG Bing . 2018年全国高性能计算学术年会 . 2018
7. 基于GPU加速的电力系统潮流并行计算方法研究 [A] . 魏国 . 2020

基于多GPU的多层神经网络并行加速训练算法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅