首页> 中国专利> 一种多个服务共享同一个GPU的方法、系统、设备及介质

一种多个服务共享同一个GPU的方法、系统、设备及介质

摘要

本发明公开了一种多个服务共享同一个GPU的方法、系统、设备和存储介质,方法包括:响应于接收到创建GPU服务的请求,根据请求创建对应的GPU服务,根据GPU服务创建对应数量的GPU Pods,将GPU服务与GPU Pods进行关联;根据GPU Pods的配置创建Kubernetes Pods,将Kubernetes Pods与GPU Pods进行关联;响应于接收到计算请求,根据计算请求确定需要申请的GPU显存或GPU时间片的规格并与GPU服务规定的阈值比对;响应于GPU显存或时间片的规格小于阈值,读取GPU Pods和Kubernetes Pods的当前资源剩余量并与GPU显存或时间片的规格比对;响应于GPU显存或时间片的规格小于GPU Pods和Kubernetes Pods的当前资源剩余量的总和,根据当前资源使用率调度GPU Pods和Kubernetes Pods进行计算。本发明的方案可以实现根据计算请求合理分配资源。

著录项

  • 公开/公告号CN113127192B

    专利类型发明专利

  • 公开/公告日2023.02.28

    原文格式PDF

  • 申请/专利权人 山东英信计算机技术有限公司;

    申请/专利号CN202110271407.8

  • 发明设计人 张荣国;

    申请日2021.03.12

  • 分类号G06F9/50;G06F9/48;G06T1/20;G06N20/00;

  • 代理机构北京连和连知识产权代理有限公司;

  • 代理人刘小峰;陈黎明

  • 地址 250101 山东省济南市高新区浪潮路1036号浪潮科技园S05号楼北3层北区

  • 入库时间 2023-03-15 00:58:13

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-02-28

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号