首页> 中国专利> 基于模仿学习和强化学习算法的无人机飞行控制方法

基于模仿学习和强化学习算法的无人机飞行控制方法

页面导航

摘要
著录项
相似文献

摘要

本发明公开一种基于模仿学习和强化学习算法的无人机飞行控制方法：创建无人机飞行仿真环境模拟器；定义飞行的基本动作集合；根据飞行基本动作将轨迹数据进行分类；对于每个飞行动作，利用模仿学习学出从飞行基本动作到原始动作的映射网络参数；统计每个基本动作的最小连续行动数量；构建上层的强化学习网络，并将最小连续行动数量作为飞机动作不一致性的惩罚p加入；在模拟器中，获取当前的观测信息和奖励，使用pDQN算法，选取对应飞行基本动作；将飞机自身的状态信息输入到飞行基本行动对应的模仿学习神经网络中，输出模拟器的原始行动；将得到的原始行动输入到模拟器中获取下个时刻的观测和奖励；使用pDQN算法进行训练，直到上层的策略网络收敛。

著录项

公开/公告号CN112162564B

专利类型发明专利
公开/公告日2021-09-28

原文格式PDF
申请/专利权人南京大学;
展开▼

申请/专利号CN202011020765.3
发明设计人俞扬;詹德川;周志华;付聪;张云天;袁雷;庞竟成;罗凡明;
展开▼

申请日2020-09-25
分类号G05D1/08(20060101);G05D1/10(20060101);
代理机构32326 南京乐羽知行专利代理事务所(普通合伙);
代理人李玉平
地址 210023 江苏省南京市栖霞区仙林大道163号
入库时间 2022-08-23 12:32:40

相似文献

专利
中文文献
外文文献

1. 基于模仿学习和强化学习算法的无人机飞行控制方法 [P] . 中国专利： CN112162564B . 2021.09.28
2. 一种基于强化学习与网络模型蒸馏的无人机飞行控制方法 [P] . 中国专利： CN113110550A . 2021-07-13
3. METHOD FOR CONTROLLING MOTION OF ROBOT BASED ON EVOLUTIONARY ALGORITHM AND IMITATION LEARNING [P] . 日本专利： JP2010058260A . 2010-03-18

机译：基于进化算法和模仿学习的机器人运动控制方法
4. EFFICIENT ADAPTION OF ROBOT CONTROL POLICY FOR NEW TASK USING META-LEARNING BASED ON META-IMITATION LEARNING AND META-REINFORCEMENT LEARNING [P] . 世界知识产权组织专利： WO2020154542A1 . 2020-07-30

机译：基于元模仿学习和元强化学习的元学习高效适应新任务的机器人控制策略
5. DRONE FLIGHT CONTROL SYSTEM AND METHOD BY MISSION BASED FLOCKING ALGORITHM USING MULTI-AGENT ARCHITECTURE [P] . 韩国专利： KR101946429B1 . 2019-05-08

机译：基于多代理架构的基于任务的植群算法的无人机飞行控制系统及方法