基于归一化优势函数的强化学习混合动力履带车辆能量管理

邹渊; 张彬; 张旭东; 赵志颖; 康铁宇; 郭玉枫; 吴喆

首页> 中文期刊> 《兵工学报》 >基于归一化优势函数的强化学习混合动力履带车辆能量管理

基于归一化优势函数的强化学习混合动力履带车辆能量管理

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

基于强化学习的能量管理策略由于状态变量和控制变量的离散化,处理高维问题时存在"维数灾难"的困扰.针对此问题,提出一种基于归一化优势函数的深度强化学习能量管理算法.采用两个具有归一化优势函数的深度神经网络实现连续控制,消除离散化.在对串联式混合动力履带车辆动力总成建模的基础上,完成深度强化学习能量管理算法的框架搭建和参数的更新过程,并将其应用于串联式混合动力履带车辆.仿真结果表明,该算法能够输出更为细化的控制量以及更小的输出波动性,与深度Q学习算法相比,对于串联式混合动力履带车辆的燃油经济性提升了3.96％.通过硬件在环仿真实验验证了强化学习能量管理算法的适应性,以及在实时控制环境下的优化效果.

著录项

来源
《兵工学报》 |2021年第10期|2159-2169|共11页
作者
邹渊; 张彬; 张旭东; 赵志颖; 康铁宇; 郭玉枫; 吴喆;
展开▼
作者单位

北京理工大学机械与车辆学院北京100081;

北京理工大学机械与车辆学院北京100081;

北京理工大学机械与车辆学院北京100081;

北京北方车辆集团有限公司北京100072;

北京北方车辆集团有限公司北京100072;

北京北方车辆集团有限公司北京100072;

北京理工大学机械与车辆学院北京100081;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TJ810.2;
关键词
履带车辆; 能量管理策略; 归一化优势函数; 连续控制; 串联式混合动力; 硬件在环仿真;

相似文献

中文文献
外文文献
专利

1. 基于越野工况预测的混合动力履带车辆能量管理策略 [J] . 许绍航 ,席军强 ,陈慧岩 . 兵工学报 . 2019,第008期
2. 国家自然科学基金委员会机械工程学科2012/2013年度结题项目简介基于随机动态规划的混合动力履带车辆双侧驱动与能量管理协调控制及优化 [J] . . 机械工程学报 . 2014,第18期
3. 基于随机动态规划的混合动力履带车辆能量管理策略 [J] . 邹渊 ,陈锐 ,侯仕杰 . 机械工程学报 . 2012,第14期
4. 基于深度强化学习的燃料电池混合动力汽车能量管理策略研究 [J] . 李卫 ,郑春花 ,许德州 . 集成技术 . 2021,第003期
5. 基于强化学习的多燃烧模式混合动力能量管理策略 [J] . 张昊 ,范钦灏 ,王巍 . 汽车工程 . 2021,第005期
6. 基于车速预测的插电式混合动力客车能量管理策略研究 [C] . 黄琨 ,苏常军 ,陈慧勇 . 第十七届河南省汽车工程科技学术研讨会 . 2020
7. 基于强化学习的插电式混合动力汽车能量管理策略研究 [A] . 彭韵寒 . 2019

基于归一化优势函数的强化学习混合动力履带车辆能量管理

摘要

著录项

相似文献

相关主题

期刊订阅