首页> 中国专利> 一种基于流水线并行的模型训练方法、装置以及设备

一种基于流水线并行的模型训练方法、装置以及设备

摘要

本说明书实施例公开了基于流水线并行的模型训练方法。包括:根据正常训练顺序对待训练模型进行切分,得到多个子切片;将正常训练顺序在前的一部分子切片划分至第一组中,构成第一子模型,将剩余的子切片划分至第二组中,构成第二子模型;将第一子模型包含的子切片分配给不同的工作方,以及将第二子模型包含的子切片分配给不同的工作方;根据调整得到的训练顺序,在被分配了子切片的工作方上为子切片分配训练时间块,训练顺序包括:针对单轮训练样本,依次执行第一子模型本周期的正向传播、第一子模型前一周期的反向传播、第二子模型本周期的正向传播、第二子模型本周期的反向传播;按照训练时间块,在多个工作方上对待训练模型进行并行训练。

著录项

  • 公开/公告号CN113177632A

    专利类型发明专利

  • 公开/公告日2021-07-27

    原文格式PDF

  • 申请/专利权人 支付宝(杭州)信息技术有限公司;

    申请/专利号CN202110396491.6

  • 发明设计人 杨鹏程;张晓明;杨明;魏宏;

    申请日2021-04-13

  • 分类号G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11716 北京君慧知识产权代理事务所(普通合伙);

  • 代理人吴绍群

  • 地址 310000 浙江省杭州市西湖区西溪路556号8层B段801-11

  • 入库时间 2023-06-19 12:00:51

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-10-14

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号