首页> 中国专利> 一种多个GPU并行的DNN模型训练方法和装置

一种多个GPU并行的DNN模型训练方法和装置

摘要

本发明公开一种多个GPU并行的DNN模型训练方法和装置,用于解决现有技术中多个GPU并行训练DNN模型时存在的训练精度低的问题。该方法包括:在前向传播处理过程中,接收前向BN输入数据子集;确定全局前向BN输入数据均值集合;根据全局前向BN输入数据均值集合,对前向BN输入数据子集进行前向BN处理,得到前向BN输出数据子集;在后向传播处理过程中,接收后向BN输入数据子集;确定全局后向BN输入数据均值集合;根据全局后向BN输入数据均值集合、后向BN输入数据子集和全局前向BN数据均值集合,对前向BN输入数据子集进行后向BN处理,得到前向BN输入数据子集中每个数据的梯度。

著录项

  • 公开/公告号CN109255439B

    专利类型发明专利

  • 公开/公告日2021-04-02

    原文格式PDF

  • 申请/专利权人 北京图森智途科技有限公司;

    申请/专利号CN201710564223.4

  • 发明设计人 龚轶凡;靳江明;苏磊;

    申请日2017-07-12

  • 分类号G06N3/08(20060101);G06N3/04(20060101);

  • 代理机构

  • 代理人

  • 地址 101300 北京市顺义区中关村科技园区顺义园临空二路1号

  • 入库时间 2022-08-23 11:37:33

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号