首页> 外国专利> TRAINING MACHINE LEARNING MODELS ON A LARGE-SCALE DISTRIBUTED SYSTEM USING A JOB SERVER

TRAINING MACHINE LEARNING MODELS ON A LARGE-SCALE DISTRIBUTED SYSTEM USING A JOB SERVER

机译:使用作业服务器的大型分布式系统上的训练机学习模型

摘要

A computer system for training machine learning models includes a job server and a plurality of compute nodes. The job server receives jobs for training machine learning models and allocates these training jobs to groups of one or more compute nodes. The allocation is based on the current requirements of the training jobs and the current status of the compute nodes. The training jobs include updating values for the parameters (e.g., weights and biases) of the machine learning models. Preferably, the compute nodes in the training group communicate the updated values of the parameters among themselves in order to complete the training job.
机译:用于训练机器学习模型的计算机系统包括作业服务器和多个计算节点。作业服务器接收用于训练机器学习模型的作业,并将这些训练作业分配给一个或多个计算节点的组。分配基于训练作业的当前要求和计算节点的当前状态。训练工作包括更新机器学习模型的参数(例如权重和偏差)的值。优选地,训练组中的计算节点之间相互传递参数的更新值,以完成训练工作。

著录项

  • 公开/公告号WO2018196631A1

    专利类型

  • 公开/公告日2018-11-01

    原文格式PDF

  • 申请/专利权人 MIDEA GROUP CO. LTD.;

    申请/专利号WO2018CN82970

  • 发明设计人 CHEN XIN;ZHOU HUA;WANG DONGYAN;

    申请日2018-04-13

  • 分类号G06F9/50;

  • 国家 WO

  • 入库时间 2022-08-21 12:42:08

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号