首页> 中国专利> 基于强化学习的零样本学习模型的训练方法及装置

基于强化学习的零样本学习模型的训练方法及装置

页面导航

摘要
著录项
相似文献

摘要

本发明公开了一种基于强化学习的零样本学习模型的训练方法及装置、计算机可读存储介质，该方法包括以下步骤：获取已训练的分类模型；固定已训练的分类模型的参数，将训练数据输入已训练的分类模型；从已训练的分类模型获取训练数据经特征提取后得到的特征数据，将特征数据转换为状态向量；将状态向量输入基于强化学习的动作预测模型，根据当前的奖赏值进行预测得到动作预测结果并执行相应的动作，以对输入的训练数据进行调整；通过损失函数优化基于强化学习的动作预测模型的参数，得到已训练的基于强化学习的动作预测模型，再与已训练的分类模型组成已训练的基于强化学习的零样本学习模型。本发明实现了进一步提高零样本学习模型的性能的效果。

著录项

公开/公告号CN111914949B

专利类型发明专利
公开/公告日2021-06-11

原文格式PDF
申请/专利权人合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室);
展开▼

申请/专利号CN202010846632.5
发明设计人张勇东;葛健男;谢洪涛;
展开▼

申请日2020-08-20
分类号G06F16/55(20190101);
代理机构44287 深圳市世纪恒程知识产权代理事务所;
代理人薛福玲
地址 230000 安徽省合肥市望江西路5089号中国科学技术大学先进研究院未来中心B1205-B1208
入库时间 2022-08-23 11:56:25

相似文献

专利
中文文献
外文文献

1. 基于强化学习的零样本学习模型的训练方法及装置 [P] . 中国专利： CN111914949B . 2021.06.11
2. 基于强化学习模型预测样本标签的方法及装置 [P] . 中国专利： CN110263979A . 2019-09-20
3. METHOD AND DEVICE FOR PUSHING OBJECT TO USER BASED ON REINFORCEMENT LEARNING MODEL [P] . 世界知识产权组织专利： WO2020220757A1 . 2020-11-05

机译：基于强化学习模型的用户对象推送方法和装置
4. Training method of deep learning models for ordinal classification using triplet-based loss and training apparatus thereof [P] . 韩国专利： KR20190140824A . 2019-12-20

机译：基于三元组损失的序数分类深度学习模型的训练方法及其训练装置
5. PUSHING ITEMS TO USERS BASED ON A REINFORCEMENT LEARNING MODEL [P] . 美国专利： US2020342268A1 . 2020-10-29

机译：基于强化学习模型的用户项目