首页> 中文会议>第十二届中国智能机器人大会 >基于强化学习的水面无人艇危险规避方法

基于强化学习的水面无人艇危险规避方法

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对水而无人艇(USV)在复杂海洋环境下执行任务时需要用户进行干预的问题,本文提出了基于逆向强化学习的行为模仿学习方法.该方法将专家的示教作为学习目标,使得USV能够从专家示教中学习导航行为.首先根据导航任务的应用背景,建立了向专家行为模仿学习的Markov决策模型,然后给出了适用于USV导航行为学习的行为模仿学习算法,该方法基于逆向强化学习根据专家的示教行为计算出具体的回报函数,并得到接近专家策略的最优导航策略.最后经过仿真实验验证,本文所提出的方法能够使USV从专家示教中学习到恰当的导航行为,并从专家示教中获得用户偏好,验证了本方法的有效性.

著录项

来源
《第十二届中国智能机器人大会》||518-522|共5页
会议地点
作者
LIU Guan-qun; 刘冠群; DUAN Li-qun; 段立群; WU Jun-wei; 吴俊伟; Zhang Ru-bo; 张汝波;
展开▼
作者单位

展开▼
会议组织
正文语种
原文格式 PDF
中图分类船舶避让操作;
关键词
水面无人艇; 危险规避; 专家示教; 模仿学习; 逆向强化学习; 回报函数;
入库时间 2022-08-17 11:29:28

相似文献

中文文献
外文文献
专利

1. 水面无人艇危险规避方法 [J] . 郭强 ,冷金英 ,马义彬 . 智能城市应用 . 2021,第001期
2. 水面无人艇危险规避方法 [J] . 庄佳园 ,张国成 ,苏玉民 . 东南大学学报（自然科学版） . 2013,第0z1期
3. 基于海事规则的水面无人艇动态障碍规避方法 [J] . 杜开君 ,茅云生 ,向祖权 . 船海工程 . 2015,第003期
4. 基于增强拓扑神经演化强化学习的水面无人艇局部路径规划 [J] . 王宝仁 ,韩婷婷 ,王凯 . 科学技术与工程 . 2020,第015期
5. 多任务约束条件下基于强化学习的水面无人艇路径规划算法 [J] . 封佳祥 ,江坤颐 ,周彬 . 舰船科学技术 . 2019,第012期
6. 水面无人艇危险规避方法 [C] . Zhuang Jiayuan ,庄佳园 ,Zhang Guocheng . 2013年中国智能自动化会议 . 2013
7. 复杂海况下水面无人艇分层危险规避方法研究 [A] . 唐平鹏 . 2014

基于强化学习的水面无人艇危险规避方法

摘要

著录项

相似文献

相关主题

期刊订阅