首页> 中国专利> 基于强化学习的零样本学习模型的训练方法及装置

基于强化学习的零样本学习模型的训练方法及装置

摘要

本发明公开了一种基于强化学习的零样本学习模型的训练方法及装置、计算机可读存储介质,该方法包括以下步骤:获取已训练的分类模型;固定已训练的分类模型的参数,将训练数据输入已训练的分类模型;从已训练的分类模型获取训练数据经特征提取后得到的特征数据,将特征数据转换为状态向量;将状态向量输入基于强化学习的动作预测模型,根据当前的奖赏值进行预测得到动作预测结果并执行相应的动作,以对输入的训练数据进行调整;通过损失函数优化基于强化学习的动作预测模型的参数,得到已训练的基于强化学习的动作预测模型,再与已训练的分类模型组成已训练的基于强化学习的零样本学习模型。本发明实现了进一步提高零样本学习模型的性能的效果。

著录项

  • 公开/公告号CN111914949B

    专利类型发明专利

  • 公开/公告日2021-06-11

    原文格式PDF

  • 申请/专利号CN202010846632.5

  • 发明设计人 张勇东;葛健男;谢洪涛;

    申请日2020-08-20

  • 分类号G06F16/55(20190101);

  • 代理机构44287 深圳市世纪恒程知识产权代理事务所;

  • 代理人薛福玲

  • 地址 230000 安徽省合肥市望江西路5089号中国科学技术大学先进研究院未来中心B1205-B1208

  • 入库时间 2022-08-23 11:56:25

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号