首页> 中国专利> 一种模型训练方法、工作节点及参数更新服务器

一种模型训练方法、工作节点及参数更新服务器

摘要

本申请公开了一种模型训练方法、工作节点及参数更新服务器,该方法包括:根据第一模型的任务类型,确定第一模型中各个网络层的目标计算精度,并基于第一模型中各个网络层的目标计算精度,利用第一模型的训练数据进行前向计算和后向计算,得到第一模型的各个网络层的网络参数的目标梯度值,以便根据该目标梯度值对第二模型进行参数更新。由于不同任务类型所需求的计算精度不同,因而,根据任务类型确定的目标计算精度更适应于该任务类型对精度的需求,从而使得在第一模型基于目标计算精度进行计算的过程中,不但可以减少在工作节点上的资源消耗和提升在工作节点上的计算加速,还可以降低因第一模型的计算精度损失带来的对第二模型的训练效果损失。

著录项

  • 公开/公告号CN110097188B

    专利类型发明专利

  • 公开/公告日2021-07-06

    原文格式PDF

  • 申请/专利权人 科大讯飞股份有限公司;

    申请/专利号CN201910362862.1

  • 发明设计人 李必然;吕亚飞;刘凯;刘远东;

    申请日2019-04-30

  • 分类号G06N3/08(20060101);G06N3/04(20060101);

  • 代理机构11227 北京集佳知识产权代理有限公司;

  • 代理人张小娜;王宝筠

  • 地址 230088 安徽省合肥市高新区望江西路666号

  • 入库时间 2022-08-23 12:05:04

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号