首页> 中国专利> 基于资源调整的深度学习模型动态批处理调度方法和系统

基于资源调整的深度学习模型动态批处理调度方法和系统

摘要

本发明提供了一种基于资源调整的深度学习模型动态批处理调度方法和系统,包括:步骤1:将深度学习推理作业按运行时消耗评估资源的种类进行任务拆分;步骤2:根据深度学习推理作业的资源种类和当前部署环境资源情况进行任务动态批处理,当满足预设停止调度条件时停止调度,当接收到新推理作业,或在可用资源发生变化时,触发新的调度。本发明通过不同运行时期运行调度当时的部署资源情况,得出此时某个推理任务的批处理推理批量大小并调度执行,可以有效的根据实时部署资源,动态调整批处理批量,利用批处理对运行效率的提升并达到对部署资源的实时充分利用,从而提升资源动态变化场景下的推理作业处理的吞吐量。

著录项

  • 公开/公告号CN114217966A

    专利类型发明专利

  • 公开/公告日2022-03-22

    原文格式PDF

  • 申请/专利权人 上海体素信息科技有限公司;

    申请/专利号CN202111543693.5

  • 申请日2021-12-16

  • 分类号G06F9/50(20060101);G06F9/48(20060101);G06F9/54(20060101);G06N3/08(20060101);G06N5/04(20060101);

  • 代理机构31334 上海段和段律师事务所;

  • 代理人李源

  • 地址 201100 上海市闵行区陈行公路2388号2幢B301室

  • 入库时间 2023-06-19 14:36:00

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-22

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号