融合类人驾驶行为的无人驾驶深度强化学习方法

吕迪; 徐坤; 李慧云; 潘仲鸣

首页> 中文期刊> 《集成技术》 >融合类人驾驶行为的无人驾驶深度强化学习方法

融合类人驾驶行为的无人驾驶深度强化学习方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

现有无人车辆的驾驶策略过于依赖感知-控制映射过程的“正确性”,而忽视了人类驾驶汽车时所遵循的驾驶逻辑.该研究基于深度确定性策略梯度算法,提出了一种具备类人驾驶行为的端到端无人驾驶控制策略.通过施加规则约束对智能体连续行为的影响,建立了能够输出符合类人驾驶连续有序行为的类人驾驶端到端控制网络,对策略输出采用了后验反馈方式,降低了控制策略的危险行为输出率.针对训练过程中出现的稀疏灾难性事件,提出了一种更符合控制策略优化期望的连续奖励函数,提高了算法训练的稳定性.不同仿真环境下的实验结果表明,改进后的奖励塑造方式在评价稀疏灾难性事件时,对目标函数优化期望的近似程度提高了85.57％,训练效率比传统深度确定性策略梯度算法提高了21％,任务成功率提高了19％,任务执行效率提高了15.45％,验证了该方法在控制效率和平顺性方面具备明显优势,显著减少了碰撞事故.

著录项

来源
《集成技术》 |2020年第5期|34-47|共14页
作者
吕迪; 徐坤; 李慧云; 潘仲鸣;
展开▼
作者单位

中国科学院深圳先进技术研究院深圳518055;

深圳市电动汽车动力平台与安全技术重点实验室深圳518055;

哈尔滨理工大学哈尔滨 150000;

中国科学院深圳先进技术研究院深圳518055;

深圳市电动汽车动力平台与安全技术重点实验室深圳518055;

中国科学院深圳先进技术研究院深圳518055;

深圳市电动汽车动力平台与安全技术重点实验室深圳518055;

中国科学院深圳先进技术研究院深圳518055;

深圳市电动汽车动力平台与安全技术重点实验室深圳518055;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TG181;
关键词
深度强化学习; 端到端控制; 无人驾驶; 类人驾驶; 奖励塑造;

相似文献

中文文献
外文文献
专利

1. 基于深度强化学习的无人驾驶优化评价方法 [J] . 李文韬 ,谢小红 ,孙晓燕 . 现代计算机（专业版） . 2021,第011期
2. 基于深度强化学习的端到端无人驾驶决策 [J] . 黄志清 ,曲志伟 ,张吉 . 电子学报 . 2020,第009期
3. 内河无人驾驶船舶驾驶行为决策模型研究 [J] . 王群 ,张庆年 ,杨杰 . 武汉理工大学学报（交通科学与工程版） . 2021,第001期
4. 基于贝叶斯网络的无人驾驶行为决策研究 [J] . 梁耀中 ,吕泽正 ,种玉祥 . 智能计算机与应用 . 2021,第002期
5. 基于贝叶斯网络的无人驾驶行为决策研究 [J] . 梁耀中 ,吕泽正 ,种玉祥 . 智能计算机与应用 . 2021,第002期
6. 民用无人驾驶技术的伦理反思——以无人驾驶汽车为例 [C] . XIE Hui-yuan ,谢惠媛 . 中国自然辩证法研究会2018年学术年会 . 2018
7. 基于人类驾驶行为的无人驾驶车辆行为决策与运动规划方法研究 [A] . 杜明博 . 2016

融合类人驾驶行为的无人驾驶深度强化学习方法

摘要

著录项

相似文献

相关主题

期刊订阅