模仿学习算法的研究与实现

张羽萌; 季晓君

首页> 中文期刊> 《电脑与电信》 >模仿学习算法的研究与实现

模仿学习算法的研究与实现

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

团队文献服务 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为优化强化学习因为奖励函数不明确造成极大误差的弊端,深入研究并实现了模仿学习算法中的行为克隆算法和数据聚合算法。通过活动图对算法流程建模,通过类图对各类之间的关系建模,通过顺序图对核心交互流程建模。根据实验结果,比较行为克隆算法和数据聚合算法的优缺点,发现行为克隆算法可以离线训练避免真实环境的交互,但会使错误累加导致结果误差;数据聚合算法必须在线与环境交互,根据策略选择观测值对应状态,解决误差累积的问题。

著录项

来源
《电脑与电信》 |2023年第5期|38-44|共7页
作者
张羽萌; 季晓君;
展开▼
作者单位

南京理工大学紫金学院计算机学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工神经网络计算机 ;
关键词
强化学习; 模仿学习; 行为克隆算法; 数据聚合算法;

相似文献

中文文献
外文文献
专利

1. 基于复合协方差函数的多任务模仿学习算法的研究与实现 [J] . 于建均 ,韩春晓 ,阮晓钢 . 北京工业大学学报 . 2016 ,第4期
2. 基于模仿学习的决策树码率自适应算法研究 [J] . 王博 ,张远 ,杨咏蓓 . 计算机工程 . 2023 ,第5期
3. 动态条件模仿学习自动驾驶算法研究 [J] . 张兴波 ,石朝侠 ,王燕清 . 计算机与数字工程 . 2023 ,第3期
4. 基于高斯过程的机器人模仿学习研究与实现 [J] . 于建均 ,韩春晓 ,阮晓钢 . 北京工业大学学报 . 2015 ,第7期
5. 一个机器学习新算法——HP算法的实现及研究 [J] . 宋晓晨 . 自动化技术与应用 . 2007 ,第10期
6. 多回报模糊强化学习算法的研究及实现 [C] . 高建清 ,王浩 ,方宝富 . 第十一届中国人工智能学术年会 . 2005
7. 面向模仿学习的生成对抗学习算法研究 [A] . 郝少璞 . 2022

模仿学习算法的研究与实现

摘要

著录项

相似文献

相关主题

期刊订阅