安全强化学习综述

王雪松; 王荣荣; 程玉虎

首页> 中文期刊>自动化学报 >安全强化学习综述

安全强化学习综述

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

强化学习(Reinforcement learning,RL)在围棋、视频游戏、导航、推荐系统等领域均取得了巨大成功.然而,许多强化学习算法仍然无法直接移植到真实物理环境中.这是因为在模拟场景下智能体能以不断试错的方式与环境进行交互,从而学习最优策略.但考虑到安全因素,很多现实世界的应用则要求限制智能体的随机探索行为.因此,安全问题成为强化学习从模拟到现实的一个重要挑战.近年来,许多研究致力于开发安全强化学习(Safe reinforcement learning,SRL)算法,在确保系统性能的同时满足安全约束.本文对现有的安全强化学习算法进行全面综述,将其归为三类:修改学习过程、修改学习目标、离线强化学习,并介绍了5大基准测试平台:Safety Gym、safe-control-gym、SafeRL-Kit、D4RL、NeoRL.最后总结了安全强化学习在自动驾驶、机器人控制、工业过程控制、电力系统优化和医疗健康领域中的应用,并给出结论与展望.

著录项

来源
《自动化学报》|2023年第9期|1813-1835|共23页
作者
王雪松; 王荣荣; 程玉虎;
展开▼
作者单位

中国矿业大学信息与控制工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类中等教育;
关键词
安全强化学习; 约束马尔科夫决策过程; 学习过程; 学习目标; 离线强化学习;
入库时间 2023-11-08 00:40:09

相似文献

中文文献
外文文献
专利

1. 深度强化学习的攻防与安全性分析综述 [J] . 陈晋音 ,章燕 ,王雪柯 . 自动化学报 . 2022,第1期
2. 强化学习提高能力切实抓好安全生产监管监察工作——陈炎生局长为全省安全生产监管监察领导干部培训班授课 [J] . 沈文 . 安全与健康（上半月版） . 2010,第12期
3. 元强化学习综述 [J] . 赵春宇 ,赖俊 . 计算机应用研究 . 2023,第1期
4. 深度强化学习求解车辆路径问题的研究综述 [J] . 杨笑笑 ,柯琳 ,陈智斌 . 计算机工程与应用 . 2023,第5期
5. 基于强化学习的自动驾驶决策研究综述 [J] . 金立生 ,韩广德 ,谢宪毅 . 汽车工程 . 2023,第4期
6. 基于强化学习的交通信号控制方法综述 [C] . Huo Yusen ,霍雨森 ,Hu Jianming . 第十二届中国智能交通年会 . 2017
7. 目的论视角下网络安全会议综述的汉译实践报告——以英国皇家国际事务研究所2011-2013年的三篇网络安全会议综述为例 [A] . 蔡微娜 . 2017

安全强化学习综述

摘要

著录项

相似文献

相关主题

期刊订阅