首页> 中国专利> 基于深度强化学习的自主水下航行器轨迹跟踪控制方法

基于深度强化学习的自主水下航行器轨迹跟踪控制方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提出了一种基于深度强化学习的自主水下航行器轨迹跟踪控制方法，属于深度强化学习和智能控制领域。首先定义AUV轨迹跟踪控制问题；然后建立AUV轨迹跟踪问题的马尔科夫决策过程模型；接着构建混合策略‑评价网络，该网络由多个策略网络和评价网络构成；最后由构建的混合策略‑评价网络求解AUV轨迹跟踪控制的目标策略，对于多个评价网络，通过定义期望贝尔曼绝对误差来评估每个评价网络的性能，在每个时间步只更新性能最差的一个评价网络，对于多个策略网络，在每个时间步随机选择一个策略网络，并采用确定性策略梯度进行更新，最终学习到的策略为所有策略网络的均值。本发明不易受到恶劣AUV历史跟踪轨迹的影响，精度高。

著录项

公开/公告号CN108803321B

专利类型发明专利
公开/公告日2020-07-10

原文格式PDF
申请/专利权人清华大学;
展开▼

申请/专利号CN201810535773.8
发明设计人宋士吉;石文杰;
展开▼

申请日2018-05-30
分类号G05B13/04(20060101);
代理机构11201 北京清亦华知识产权代理事务所(普通合伙);
代理人廖元秋
地址 100084 北京市海淀区清华园1号
入库时间 2022-08-23 11:05:00

法律信息

法律状态公告日

法律状态信息

法律状态
2020-07-10

授权

授权
2018-12-07

实质审查的生效 IPC(主分类):G05B13/04 申请日:20180530

实质审查的生效
2018-11-13

公开

公开

相似文献

专利
中文文献
外文文献

1. 基于深度强化学习的自主水下航行器轨迹跟踪控制方法 [P] . 中国专利： CN108803321B . 2020.07.10
2. 一种基于数据驱动的自主水下航行器轨迹跟踪控制方法 [P] . 中国专利： CN111880409A . 2020-11-03
3. 4D PRINTING-BASED FLEXIBLE FINGER JOINT GRIPPER AND TRAJECTORY TRACKING CONTROL METHOD THEREFOR [P] . WO2021184461A1 . 2021-09-23

机译：基于印刷的柔性手指接头夹具和轨迹跟踪控制方法
4. TRACKING METHOD AND TRACK FORMAT BASED ON RADIAL CROSS-TALK FROM ADJACENT TRACKS [P] . 欧洲知识产权局专利： EP1044450B1 . 2006-05-10

机译：基于径向轨迹的径向轨迹跟踪方法和轨迹格式
5. TRACKING METHOD AND TRACK FORMAT BASED ON RADIAL CROSS-TALK FROM ADJACENT TRACKS [P] . 欧洲知识产权局专利： EP1044450A1 . 2000-10-18

机译：基于径向轨迹的径向轨迹跟踪方法和轨迹格式