首页> 中文期刊>小型微型计算机系统 >基于多GPU的并行BP算法及优化

基于多GPU的并行BP算法及优化

     

摘要

在语音识别领域,基于深度神经网络(Deep Neural Network,DNN)的声学模型与传统的基于高斯混合模型的声学模型相比具有更出色的识别效果.DNN模型主要使用误差反向传播(Back Propagation,BP)算法进行训练.由于DNN参数规模非常庞大,使用BP算法对其训练是一个异常耗时的过程.目前主要通过高性能的GPU设备对DNN模型的训练训练进行加速.本文探究了BP训练算法在多GPU设备上并行化时所存在的收敛性和带宽问题,并结合NVIDIA Kepler架构的硬件特性提出一种并行优化策略.实验结果表明优化后的算法可以有效增加小mini-batch下的GPU利用率,同时减少数据传输的开销.在相同的mini-batch尺寸下,优化后的算法在4块NVIDIA Tesla K20m设备上与单个NVIDIA Tesla K20m设备相比可以取得高达3.89倍的加速比.

著录项

  • 来源
    《小型微型计算机系统》|2016年第4期|748-752|共5页
  • 作者单位

    中国科学与技术大学计算机科学与技术学院,合肥230027;

    中国科学技术大学中国科学院沈阳计算所网络与通信联合实验室,合肥230027;

    科大讯飞股份有限公司,合肥230027;

    科大讯飞股份有限公司,合肥230027;

    中国科学与技术大学计算机科学与技术学院,合肥230027;

    中国科学技术大学中国科学院沈阳计算所网络与通信联合实验室,合肥230027;

    中国科学与技术大学计算机科学与技术学院,合肥230027;

    中国科学技术大学中国科学院沈阳计算所网络与通信联合实验室,合肥230027;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    深度神经网络; 并行; GPU利用率; 传输开销;

  • 入库时间 2023-07-24 22:44:20

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号