基于强化学习DDPG的智能车辆轨迹跟踪控制

贺伊琳; 宋若旸; 马建

首页> 中文期刊>中国公路学报 >基于强化学习DDPG的智能车辆轨迹跟踪控制

基于强化学习DDPG的智能车辆轨迹跟踪控制

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对智能车辆在轨迹跟踪过程中的横向控制问题,提出一种基于强化学习中深度确定性策略梯度算法(Deep Deterministic Policy Gradient, DDPG)的智能车辆轨迹跟踪控制方法。首先,将智能车辆的跟踪控制描述为一个基于马尔可夫决策过程(MDP)的强化学习过程,强化学习的主体是由Actor神经网络和Critic神经网络构成的Actor-Critic框架;强化学习的环境包括车辆模型、跟踪模型、道路模型和回报函数。其次,所提出方法的学习主体以DDPG方法更新,其中采用回忆缓冲区解决样本相关性的问题,复制结构相同的神经网络解决更新发散问题。最后,将所提出的方法在不同场景中进行训练验证,并与深度Q学习方法(Deep Q-Learning, DQN)和模型预测控制(Model Predictive Control, MPC)方法进行比较。研究结果表明:基于DDPG的强化学习方法所用学习时间短,轨迹跟踪控制过程中横向偏差和角偏差小,且能满足不同车速下的跟踪要求;采用DDPG和DQN强化学习方法在不同场景下均能达到训练片段的最大累计回报;在2种仿真场景中,基于DDPG的学习总时长分别为DQN的9.53%和44.19%,单个片段的学习时长仅为DQN的20.28%和22.09%;以DDPG、DQN和MPC控制方法进行控制时,在场景1中,基于DDPG方法的最大横向偏差分别为DQN和MPC的87.5%和50%,仿真时间分别为DQN和MPC的12.88%和53.45%;在场景2中,基于DDPG方法的最大横向偏差分别为DQN和MPC的75%和21.34%,仿真时间分别为DQN和MPC的20.64%和58.60%。

著录项

来源
《中国公路学报》|2021年第11期|335-348|共14页
作者
贺伊琳; 宋若旸; 马建;
展开▼
作者单位

长安大学汽车学院,陕西西安710064;

展开▼
原文格式 PDF
正文语种 chi
中图分类汽车理论;
关键词
汽车工程; 轨迹跟踪; DDPG; 智能车辆; 强化学习; 神经网络;

相似文献

中文文献
外文文献
专利

1. 基于改进LQR智能车辆轨迹跟踪控制器研究 [J] . 万兆宝 ,甘海云 ,张翔宇 . 汽车周刊 . 2023,第11期
2. 基于模型预测控制的智能车辆轨迹跟踪研究 [J] . 刘林 ,葛万成 . 信息与电脑 . 2022,第4期
3. 基于转向响应特性的智能车辆轨迹跟踪双闭环控制 [J] . 徐彬 ,张大鹏 ,杨海洋 . 北京理工大学学报 . 2022,第7期
4. 基于车辆动力学混合模型的智能汽车轨迹跟踪控制方法 [J] . 方培俊 ,蔡英凤 ,陈龙 . 汽车工程 . 2022,第10期
5. 基于MPC的智能车辆变轨迹跟踪控制研究 [J] . 贺晓丽 . 装备制造技术 . 2022,第10期
6. 基于模糊自适应PID的智能车辆路径跟踪控制 [C] . 肖灵芝 . 第六届中国城市智能交通论坛 . 2010
7. 基于模型预测控制的智能车辆轨迹规划及跟踪控制 [A] . 黄梅 . 2020

基于强化学习DDPG的智能车辆轨迹跟踪控制

摘要

著录项

相似文献

相关主题

期刊订阅