首页> 中国专利> 一种面向深度学习模型推理批处理优化方法与系统

一种面向深度学习模型推理批处理优化方法与系统

摘要

本发明公开了一种面向深度学习模型推理批处理优化方法与系统。本系统包括负载容器批处理分析工具模块和批处理合并工具模块、算法服务调用模块;负载容器批处理分析工具模块,用于将推理服务请求中的推理输入参数保存到预处理数据集中,生成训练数据对各容器中的模型进行性能测试,然后根据测试的结果指标确定最佳参数;批处理合并工具模块根据最佳参数预测并获取下一时间窗口的推理服务请求生成批处理任务并发送到对应容器中执行。本发明对无服务器架构下的深度学习推理服务性能进行优化,有效的利用多核并行计算能力,能够高效的进行高并发下的推理服务请求,使得在资源利用率,任务执行延时、吞吐量方面得到了大幅度优化。

著录项

  • 公开/公告号CN113902116A

    专利类型发明专利

  • 公开/公告日2022-01-07

    原文格式PDF

  • 申请/专利权人 中国科学院软件研究所;

    申请/专利号CN202111151184.8

  • 申请日2021-09-29

  • 分类号G06N5/04(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11200 北京君尚知识产权代理有限公司;

  • 代理人司立彬

  • 地址 100190 北京市海淀区中关村南四街4号

  • 入库时间 2023-06-19 13:35:32

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号