深度确定性策略梯度算法用于无人飞行器控制

黄旭; 柳嘉润; 贾晨辉; 王昭磊; 张隽

首页> 中文期刊> 《航空学报》 >深度确定性策略梯度算法用于无人飞行器控制

深度确定性策略梯度算法用于无人飞行器控制

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

对深度确定性策略梯度算法训练智能体学习小型无人飞行器的飞行控制策略进行了探索研究.以多数据帧的速度、位置和姿态角等信息作为智能体的观察状态,舵摆角和发动机推力指令作为智能体的输出动作,飞行器的非线性模型和飞行环境作为智能体的学习环境.智能体在与环境交互过程中除了获得包含误差信息的密集惩罚外,也有达成一定目标的稀疏奖励,该设计有效提高了飞行数据的样本多样性,增强了智能体的学习效率.最后智能体实现了从位置、速度和姿态角等信息到控制量的端到端飞行控制,并进行了变航迹点、模型参数拉偏、注入扰动和故障条件下的飞行控制仿真,结果表明智能体除了能有效完成训练任务外,还能应对多种训练时未学习的飞行任务,具有优秀的泛化能力和鲁棒性,该方法具有一定的研究价值和工程参考价值.

著录项

来源
《航空学报》 |2021年第11期|397-407|共11页
作者
黄旭; 柳嘉润; 贾晨辉; 王昭磊; 张隽;
展开▼
作者单位

北京航天自动控制研究所北京 100854;

宇航智能控制技术国家级重点实验室北京 100854;

北京航天自动控制研究所北京 100854;

宇航智能控制技术国家级重点实验室北京 100854;

北京航天自动控制研究所北京 100854;

宇航智能控制技术国家级重点实验室北京 100854;

北京航天自动控制研究所北京 100854;

宇航智能控制技术国家级重点实验室北京 100854;

北京航天自动控制研究所北京 100854;

宇航智能控制技术国家级重点实验室北京 100854;

展开▼
原文格式 PDF
正文语种 chi
中图分类飞行控制;航天器制导与控制;
关键词
深度确定性策略梯度; 小型无人飞行器; 飞行控制; 端到端; 稀疏奖励;

相似文献

中文文献
外文文献
专利

1. 基于深度确定性策略梯度算法的双轮机器人平衡控制研究 [J] . 刘胜祥 ,林群煦 ,杨智才 . 机械工程师 . 2020,第003期
2. 基于深度确定性策略梯度算法的战机规避中距空空导弹研究 [J] . 宋宏川 ,詹浩 ,夏露 . 航空工程进展 . 2021,第003期
3. 采用双经验回放池的噪声流双延迟深度确定性策略梯度算法 [J] . 王垚儒 ,李俊 . 武汉科技大学学报（自然科学版） . 2020,第002期
4. 优化深度确定性策略梯度算法 [J] . 柯丰恺 ,周唯倜 ,赵大兴 . 计算机工程与应用 . 2019,第007期
5. 基于确定性策略梯度算法的机械臂控制模型构建及仿真 [J] . 贾红涛 ,胡文娟 . 粘接 . 2021,第009期
6. 用于无人飞行器位姿估计的图像处理算法和验证 [C] . Zhang Xiao-long ,张晓龙 ,Xu Jin-fa . 第二十九届全国直升机年会 . 2013
7. 基于连续控制任务的确定性策略梯度算法研究 [A] . 王振宇 . 2021

深度确定性策略梯度算法用于无人飞行器控制

摘要

著录项

相似文献

相关主题

期刊订阅