首页> 中国专利> 一种用于分布式深度学习训练的本地更新方法

一种用于分布式深度学习训练的本地更新方法

摘要

本发明公开了一种用于分布式深度学习训练的本地更新方法,具体包括以下步骤:对从参数服务器端取回的全局权重进行备份并保存到备份权重变量中;在每个计算节点中计算全局梯度;利用本地梯度和全局梯度对本地权重进行更新得到新的本地权重,并开始下一轮的迭代训练;在接下来的k‑1次迭代训练中,每个计算节点将基于各自独立的本地权重进行本地更新操作;在第k次迭代中,计算节点将执行该权重取回操作并保存到本地权重中,在完成全局梯度计算后,利用本地权重对备份权重的值进行覆盖。利用本发明进行分布式深度学习训练中的本地更新操作时,可以获得最高的模型收敛精度和训练速度。

著录项

  • 公开/公告号CN112381218A

    专利类型发明专利

  • 公开/公告日2021-02-19

    原文格式PDF

  • 申请/专利权人 中国人民解放军国防科技大学;

    申请/专利号CN202011312705.9

  • 发明设计人 董德尊;徐叶茂;徐炜遐;廖湘科;

    申请日2020-11-20

  • 分类号G06N3/063(20060101);G06N20/00(20190101);

  • 代理机构11781 北京丰浩知识产权代理事务所(普通合伙);

  • 代理人董超

  • 地址 410073 湖南省长沙市开福区德雅路109号

  • 入库时间 2023-06-19 09:57:26

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-04-12

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号