基于动作约束深度强化学习的安全自动驾驶方法

代珊珊; 刘全

首页> 中文期刊>计算机科学 >基于动作约束深度强化学习的安全自动驾驶方法

基于动作约束深度强化学习的安全自动驾驶方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着人工智能的发展,自动驾驶领域的研究也日益壮大.深度强化学习(Deep Reinforcement Learning,DRL)方法是该领域的主要研究方法之一.其中,安全探索问题是该领域的一个研究热点.然而,大部分DRL算法为了提高样本的覆盖率并没有对探索方法进行安全限制,使无人车探索时会陷入某些危险状态,从而导致学习失败.针对该问题,提出了一种基于动作约束的软行动者-评论家算法(Constrained Soft Actor-critic,CSAC),该方法首先对环境奖赏进行了合理限制.无人车动作转角过大时会产生抖动,因此在奖赏函数中加入惩罚项,使无人车尽量避免陷入危险状态.另外,CSAC方法又对智能体的动作进行了约束.当目前状态选择动作后使无人车偏离轨道或者发生碰撞时,标记该动作为约束动作,在之后的训练中通过合理约束来更好地指导无人车选择新动作.为了体现CSAC方法的优势,将CSAC方法应用在自动驾驶车道保持任务中,并与SAC算法进行对比.结果表明,引入安全机制的CSAC方法可以有效避开不安全动作,提高自动驾驶过程中的稳定性,同时还加快了模型的训练速度.最后,将训练好的模型移植到带有树莓派的无人车上,进一步验证了模型的泛用性.

著录项

来源
《计算机科学》|2021年第9期|235-243|共9页
作者
代珊珊; 刘全;
展开▼
作者单位

苏州大学计算机科学与技术学院江苏苏州215006;

苏州大学计算机科学与技术学院江苏苏州215006;

苏州大学江苏省计算机信息处理技术重点实验室江苏苏州215006;

吉林大学符号计算与知识工程教育部重点实验室长春 130012;

软件新技术与产业化协同创新中心南京210000;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
安全自动驾驶; 深度强化学习; 软行动者-评论家; 车道保持; 无人车;
入库时间 2022-08-20 08:47:21

相似文献

中文文献
外文文献
专利

1. 基于深度强化学习的自动驾驶策略学习方法 [J] . 夏伟 ,李慧云 . 集成技术 . 2017,第003期
2. 基于深度强化学习的四足机器人后空翻动作生成方法 [J] . 李岸荞 ,王志成 ,古勇 . 导航定位与授时 . 2021,第006期
3. 规则约束下基于深度强化学习的船舶避碰方法 [J] . 周双林 ,杨星 ,刘克中 . 中国航海 . 2020,第003期
4. 基于深度强化学习的单目视觉自动驾驶决策系统 [J] . 杨明珠 . 自动化博览 . 2020,第005期
5. 基于深度强化学习的自动驾驶车控制算法研究 [J] . 王丙琛 ,司怀伟 ,谭国真 . 郑州大学学报（工学版） . 2020,第004期
6. 自动驾驶车辆安全性测试评价方法 [C] . Xia Qin ,夏芹 ,Chen Tao . 第十九届汽车安全技术学术会议 . -1
7. 基于深度强化学习的网联自动驾驶车辆决策控制方法 [A] . 白正伟 . 2020

基于动作约束深度强化学习的安全自动驾驶方法

摘要

著录项

相似文献

相关主题

期刊订阅