首页> 外国专利> System with Hybrid Communication Strategy for Large-Scale Distributed Deep Learning

System with Hybrid Communication Strategy for Large-Scale Distributed Deep Learning

机译:大规模分布式深度学习的混合通信策略系统

摘要

A computer in a distributed computing system is disclosed. The computer includes: a graphics processing unit (GPU) memory; a central processing unit (CPU) memory comprising a Key-Value Store (KVS) module; an execution engine module configured to run a deep learning (DL) program to create a plurality of operator graph layers in the graphics processing unit memory; a client library module configured to create a GPU-CPU synchronization (GCS) module for each of the plurality of operator graph layers; a coordination service module configured to compute network cost of a first and a second communication scheme and select, based on the network cost, one of the first and second communication scheme for transmitting data associated with one of the plurality of operator graph layers from a corresponding GCS module.
机译:公开了一种分布式计算系统中的计算机。该计算机包括:图形处理单元(GPU)存储器;以及中央处理器(CPU)存储器,包括键值存储(KVS)模块;执行引擎模块,被配置为运行深度学习(DL)程序以在图形处理单元存储器中创建多个操作员图形层;客户端库模块,被配置为为所述多个操作员图层中的每一个创建GPU-CPU同步(GCS)模块;协调服务模块,被配置为计算第一和第二通信方案的网络成本,并基于该网络成本,选择第一和第二通信方案中的一个,用于从对应的传输与多个运营商图表层之一相关联的数据GCS模块。

著录项

  • 公开/公告号US2019266515A9

    专利类型

  • 公开/公告日2019-08-29

    原文格式PDF

  • 申请/专利权人 PETUUM INC.;

    申请/专利号US201715814394

  • 发明设计人 WEI DAI;HAO ZHANG;ERIC XING;QIRONG HO;

    申请日2017-11-16

  • 分类号G06N99;

  • 国家 US

  • 入库时间 2022-08-21 12:07:14

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号