首页> 中国专利> 一种基于DL框架下的分布式训练方法

一种基于DL框架下的分布式训练方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于DL框架下的分布式训练方法，该方法包括以下步骤：A1，通过调度层收集用户的GPU数量需求，通过调度算法将调配相应数量的GPU机器给集群；A2，集群通过gRPC框架调用训练任务参数信息传给AI底层框架；A3，AI底层进行环境初始化工作，创建用户任务容器并开始训练，同时将将训练过程的结果实时输出；A4,训练等信号至集群，集群根据AI底层框架的返回状态码进行判断机制。本发明充分利用了通信资源，降低了训练成本。

著录项

公开/公告号CN111274018A

专利类型发明专利
公开/公告日2020-06-12

原文格式PDF
申请/专利权人行星算力(深圳)科技有限公司;
展开▼

申请/专利号CN202010071243.X
发明设计人郭金;曾令候;邓宏;米艳杰;杨春;兰毅;
展开▼

申请日2020-01-21
分类号
代理机构重庆中流知识产权代理事务所(普通合伙);
代理人魏鹏
地址 518052 广东省深圳市南山区南头街道南联社区同乐路厂房A5栋501-5g
入库时间 2023-12-17 09:16:50

法律信息

法律状态公告日

法律状态信息

法律状态
2020-07-07

实质审查的生效 IPC(主分类):G06F9/48 申请日:20200121

实质审查的生效
2020-06-12

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于DL框架下的分布式训练方法 [P] . 中国专利： CN111274018A . 2020-06-12
2. 一种基于分布式计算框架下海量数据加权top-k查询方法 [P] . 中国专利： CN104809210A . 2015-07-29
3. METHOD AND APPARATUS FOR TRAINING A CHARACTER DETECTOR BASED ON WEAK SUPERVISION, SYSTEM AND MEDIUM [P] . 美国专利： US2020250416A1 . 2020-08-06

机译：一种基于弱监督的字符检测器训练方法及装置，系统和介质
4. METHOD AND APPARATUS FOR TRAINING A CHARACTER DETECTOR BASED ON WEAK SUPERVISION, SYSTEM AND MEDIUM [P] . 美国专利： US2019205638A1 . 2019-07-04

机译：一种基于弱监督的字符检测器训练方法及装置，系统和介质
5. METHOD OF TRAINING TO THE DETERMINATION OF THE AREA OF A RADIATION EMERGENCY SITUATION ON THE BASIS OF A MODELED ACCIDENT [P] . 俄罗斯专利： RU2669871C1 . 2018-10-16

机译：一种基于模拟事故的确定辐射紧急情况区域的训练方法