首页> 中国专利> 一种动态环境下基于强化学习算法的路径规划方法

一种动态环境下基于强化学习算法的路径规划方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种动态环境下基于强化学习算法的路径规划方法，包括以下步骤：根据动态已知环境利用栅格法对作业环境进行建模，根据作业任务设置起始点和目标点；基于时间变量t构建改进的Q‑learning算法并赋予智能体停止动作；根据起始点和目标点坐标基于改进的Q‑learning算法对动态已知环境进行学习并输出规划路径；通过智能体探索学习动态未知环境状态并得到输出最优路径；在训练完成后速度非常快，其归因于机器学习算法的学习属性；在效果方面，无论环境是何种情况，该算法皆不会产生碰撞，其在路径规划中的应用将会非常广泛；在结果方面，由于智能体被赋予了新的停止的动作，使得在规划中可以找到更优的路径。

著录项

公开/公告号CN111649758A

专利类型发明专利
公开/公告日2020-09-11

原文格式PDF
申请/专利权人华东师范大学;
展开▼

申请/专利号CN202010545587.X
发明设计人吕长虹;朱玥炜;
展开▼

申请日2020-06-16
分类号G01C21/34(20060101);
代理机构31306 上海愉腾专利代理事务所(普通合伙);
代理人唐海波
地址 200065 上海市普陀区中山北路3663号
入库时间 2023-06-19 08:14:27

法律信息

法律状态公告日

法律状态信息

法律状态
2023-09-15

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 一种动态环境下基于强化学习算法的路径规划方法 [P] . 中国专利： CN111649758A . 2020-09-11
2. 一种基于深度强化学习算法的移动sink路径规划方法 [P] . 中国专利： CN109936865B . 2021.01.15
3. Method and Apparatus for Path Planning of Unmanned Ground Vehicle in Dynamic Environment [P] . 韩国专利： KR101551701B1 . 2015-09-10

机译：动态环境下无人地面车辆路径规划的方法和装置
4. System for the energy saving pre-cooling/heating training of an air conditioner using deep reinforcement learning algorithm based on the user location living climate condition and method thereof [P] . 韩国专利： KR102131414B1 . 2020-07-08

机译：基于用户所在地生活气候条件的深度强化学习算法的空调节能预冷/热训系统及方法
5. REINFORCEMENT LEARNING ALGORITHM-BASED SELF-CORRECTION CONTROL METHOD FOR DOUBLE-FED INDUCTION WIND GENERATOR [P] . 世界知识产权组织专利： WO2018145498A1 . 2018-08-16

机译：双馈感应风力发电机的基于强化学习算法的自校正控制方法