深度强化学习中稀疏奖励问题研究综述

杨惟轶; 白辰甲; 蔡超; 赵英男; 刘鹏

首页> 中文期刊> 《计算机科学》 >深度强化学习中稀疏奖励问题研究综述

深度强化学习中稀疏奖励问题研究综述

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

cqvip:强化学习作为机器学习的重要分支,是在与环境交互中寻找最优策略的一类方法。强化学习近年来与深度学习进行了广泛结合,形成了深度强化学习的研究领域。作为一种崭新的机器学习方法,深度强化学习同时具有感知复杂输入和求解最优策略的能力,可以应用于机器人控制等复杂决策问题。稀疏奖励问题是深度强化学习在解决任务中面临的核心问题,在实际应用中广泛存在。解决稀疏奖励问题有利于提升样本的利用效率,提高最优策略的水平,推动深度强化学习在实际任务中的广泛应用。文中首先对深度强化学习的核心算法进行阐述;然后介绍稀疏奖励问题的5种解决方案,包括奖励设计与学习、经验回放机制、探索与利用、多目标学习和辅助任务等;最后对相关研究工作进行总结和展望。

著录项

来源
《计算机科学》 |2020年第3期|182-191|共10页
作者
杨惟轶; 白辰甲; 蔡超; 赵英男; 刘鹏;
展开▼
作者单位

中国联通网络技术研究院北京 100048;

哈尔滨工业大学计算机科学与技术学院哈尔滨 150001;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
深度强化学习; 深度学习; 强化学习; 稀疏奖励; 人工智能;

相似文献

中文文献
外文文献
专利

1. 缓解数据稀疏性问题的传统技术研究综述 [J] . 陈金晨 . 数据通信 . 2021,第002期
2. 科学奖励模型与科学奖励中的社会因素问题 [J] . 王彦雨 ,马来平 . 河南社会科学 . 2007,第005期
3. 正强化在高校日常管理中的应用实践——以大学生奖励机制中的存在问题为切入点 [J] . 唐勤 ,江丰伟 . 商情 . 2010,第022期
4. 使用关联检索缓和推荐系统中的稀疏性问题 [J] . 张洋 ,高艳华 ,郭晓坤 . 计算机仿真 . 2021,第009期
5. 推荐系统中的稀疏性和可扩展性问题研究 [J] . 冷亚军 ,王翔 . 内蒙古科技与经济 . 2020,第018期
6. 奖励能改变分享者原有的品牌至爱吗?——奖励在体验分享中的影响研究 [C] . Yang Defeng ,杨德锋 ,Jiang Xia . 2013年JMS第十届中国营销科学学术年会暨博士生论坛 . 2013
7. 基于分层强化学习算法的稀疏奖励问题研究 [A] . 邢立波 . 2020

深度强化学习中稀疏奖励问题研究综述

摘要

著录项

相似文献

相关主题

期刊订阅