自适应动态规划
自适应动态规划的相关文献在2008年到2022年内共计162篇,主要集中在自动化技术、计算机技术、电工技术、公路运输
等领域,其中期刊论文92篇、会议论文4篇、专利文献240684篇;相关期刊54种,包括信息系统工程、中南大学学报(自然科学版)、电子科技大学学报等;
相关会议4种,包括第七届社会计算会议、第29届中国控制会议、第33期双清论坛——基于数据的控制、决策、调度与故障诊断等;自适应动态规划的相关文献由406位作者贡献,包括刘德荣、刘春生、赵冬斌等。
自适应动态规划—发文量
专利文献>
论文:240684篇
占比:99.96%
总计:240780篇
自适应动态规划
-研究学者
- 刘德荣
- 刘春生
- 赵冬斌
- 孙景亮
- 张化光
- 殷林飞
- 罗艳红
- 薄迎春
- 丁荣军
- 叶俊
- 岳东
- 徐彪
- 朱圆恒
- 林小峰
- 王晓伟
- 王鼎
- 秦兆博
- 秦晓辉
- 秦洪懋
- 胡满江
- 谢国涛
- 边有钢
- 高放
- 何宇婷
- 刘富
- 刘晨
- 夏宏兵
- 安毅
- 崔黎黎
- 张晶琼
- 张欣
- 惠东
- 戈新生
- 戴姣
- 李元春
- 李晓理
- 李来鸿
- 李相俊
- 章云
- 董博
- 贾学翠
- 丁坤
- 万文娅
- 丛文姿
- 丰富
- 乔俊飞
- 于洋
- 何世恩
- 全福祥
- 冯小峰
-
-
王睿;
孙秋野;
张化光
-
-
摘要:
含多类型分布式电源的微电网已经成为了未来电力系统的重要发展方向,其中风能和光能在降低化石能源消耗和二氧化碳排放等方面有着极大优势,考虑二者之间强互补性的协同调度已被广泛研究.但风/光协同调度的微电网多关注分钟级的调度或优化问题而非风/光波动下秒级的实时电流按容量比例精准分担,简称电流均衡,而精准电流均衡有助于可再生能源的高比例消纳.因此,本文提出了基于自适应动态规划的微电网电流均衡和电压恢复控制策略.首先,构建包含风电整流型电能变换器和光电升压型电能变换器的广义风光拓扑同胚升压变换器模型,其提供了后续控制器设计的模型基础.其次,本文将电流均衡和电压恢复问题转化为最优控制问题,基于此,每个能源主体的目标函数转化为获取最优控制变量和最小电压/电流控制偏差,进而转化为求解哈密顿−雅克比−贝尔曼(Hamilton-Jacobi-Bellman,HJB)方程问题.基于此,提出了基于贝尔曼准则的分布式自适应动态规划控制策略以求取HJB方程的数值解,最终实现电流均衡和电压恢复.最后仿真结果验证了所提分布式自适应动态规划控制策略的有效性.
-
-
胡树良;
黄伟;
陆文丽;
莫锦传
-
-
摘要:
针对某款双行星排混合动力客车,提出基于自适应动态规划算法的能量管理策略。通过Matlab软件搭建整车仿真模型;在C-WTVC工况下将该控制策略与基于DP算法控制策略、A_ECMS控制策略进行对比仿真分析。仿真结果表明:基于ADP的能量管理策略经过训练可快速收敛到全局最优解,具有良好的适应性;ADP工作模式与基于DP全局优化算法控制策略的工作模式接近,混动模式在驱动模式的占比在48%左右;ADP达到维持SOC平衡的目标的同时,百公里油耗与DP算法控制策略的差距仅为10.77%,具有较好的经济性。
-
-
梅俊;
顾和平
-
-
摘要:
研究了连续非线性系统的最优采样控制问题.首先,结合零阶保持器的思想设计了采样控制机制;然后,利用评价神经网络逼近未知的最优成本函数,进而设计出一种最优采样控制器,在此控制器下得到系统是一致最终有界的;此外,还通过仿真验证了所提方法的可行性以及较传统方法的优越性.
-
-
陈必露;
刘春生;
袁斐然
-
-
摘要:
针对导弹纵向通道存在干扰影响的问题,设计了一种复合控制方案。首先,选取超螺旋干扰观测器估计未知干扰,并设计积分滑模控制器补偿输入干扰产生的影响;其次,基于微分对策理论,结合自适应动态规划算法,设计单评价神经网络在线求解自适应最优控制器来抑制非匹配干扰,利用Lyapunov稳定性理论证明了闭环系统的稳定性和评价网络权值的收敛性;最后,对导弹纵向动力学进行建模仿真,验证了所提复合控制策略的有效性。
-
-
袁斐然;
刘春生;
陈必露
-
-
摘要:
针对多对一追逃博弈(PE)问题,提出了显性协同框架下的最优追逃控制策略。首先,利用图论工具将多对一追逃博弈问题转化为多智能体系统一致性控制问题;然后,结合自适应动态规划(ADP)技术,设计评价网络对追逃双方控制策略进行在线求解,并利用Lyapunov法证明稳定性。考虑到追逃策略总是成对出现,单个逃逸者面对多方追击时存在多个逃逸策略难以选择的问题,提出整体逃逸策略是各单一逃逸策略的动态加权的控制算法;最后,通过对导弹协同攻防过程建模并进行对比仿真,证明了所提博弈策略的有效性。
-
-
袁君;
章云;
张桂东;
李忠;
陈哲;
于晟龙
-
-
摘要:
自适应动态规划(Adaptive Dynamic Programming, ADP)作为最优控制领域的研究热点,其在能量管理系统(Energy Management System, EMS)领域中有着广泛的应用。ADP算法是通过系统输入输出数据自适应调整控制策略实现优化控制,尤其在解决复杂非线性系统最优控制问题方面具有强大优势。本文介绍了ADP算法的研究进展及其在EMS领域的应用,分析了该算法在离散EMS和连续EMS的研究现状和算法实现方式,并介绍了实时自适应动态规划(Real-time Adaptive Dynamic Programming, RT-ADP)算法及其应用的可行性。
-
-
郭建国;
胡冠杰;
郭宗易;
王国庆
-
-
摘要:
针对导弹导引头存在的天线罩误差,提出了一种基于自适应动态规划(ADP)的制导策略。不同于传统处理天线罩误差的估计与补偿方式,避免了估计过程中产生的误差影响。在导弹拦截机动目标的场景下,将拦截问题转化为鲁棒最优控制问题。设计了一种既可以消除天线罩误差和目标机动影响,又可以保证控制能量最小的代价函数。通过构造评价网络,利用自适应动态规划来求解近似鲁棒最优制导策略,并附加鲁棒控制项得到最终的机动目标拦截制导策略。采用李雅普诺夫稳定性理论证明了权值误差的一致最终有界和闭环系统的渐近稳定。仿真结果验证了所提出制导策略对天线罩误差下拦截机动目标的有效性。
-
-
赵新宇;
汪文涛;
张丽丽;
夏宏兵
-
-
摘要:
考虑可重构机器人系统发生执行器突变故障情形,提出一种基于改进代价函数的容错优化控制。利用观测器在线估计技术,设计一种显含故障信息的代价函数。构建评价神经网络获取近似最优反馈控制律,并结合标称控制律构成容错控制律,实现系统的安全优化控制。利用稳定性理论分析了故障观测误差、评价网络权值误差、闭环系统的稳定性。仿真实验表明所提方法的容错性能与跟踪性能较好,能够有效解决可重构机器人系统发生执行器突变故障,保证系统的安全可靠性。
-
-
郝立超;
刘洋;
刘守恒;
姜展鹏
-
-
摘要:
当电动汽车(electric vehicles,EVs)切入或切出充电桩时,会引起配电网功率急剧变化,进而增加配电网频率的波动性。提出一种通过引入大容量超导磁储能(superconducting magnetic energy storage,SMES)系统来提高配电网频率稳定性的方法。在传统PID控制的基础上,建立一种无模型的自适应动态规划控制方法,使SMES在EVs切入充电桩时放电,EVs处于稳态充电阶段时存储电能,EVs切出充电桩时进行充电。分别对2种控制方法进行仿真验证,得出配电网输入功率和配电网频率实时特征曲线,结果表明,基于自适应动态规划的控制方法更有利于提高配电网频率的稳定性。
-
-
吉月辉;
周海亮;
车适行;
高强
-
-
摘要:
针对再入飞行器的姿态跟踪问题,基于递归神经网络提出最优跟踪控制.采用反步法和递归神经网络,设计自适应前馈控制,将再入飞行器的最优姿态跟踪问题转化为等价的姿态角误差/角速率误差最优调节问题.采用自适应动态规划技术,解决最优调节问题.引入神经网络估计最优控制中的代价函数,推导最优反馈控制律,同时保证Hamilton–Jacobi–Isaacs(HJI)方程估计误差最小化.采用Lyapunov理论,保证闭环系统中所有信号,包括姿态角跟踪误差是一致最终有界的.在MATLAB/Simulink中仿真验证了所提出控制策略的有效性.
-
-
张弛;
齐义文;
邢宁
- 《第六届空天动力联合会议暨中国航天第三专业信息网第四十二届技术交流会暨2021航空发动机技术发展高层论坛》
| 2021年
-
摘要:
针对航空发动机传统控制方法适应性与自整定能力有限等问题,提出了一种自适应动态规划转速控制方法.本文探索了面向控制的Actor网络设计、面向学习的Critic网络设计、面向性能的效用函数设计、网络单步更新时间序列设计、归一化参数配置、面向模型的交互与更新设计等关键技术.通过模拟仿真使控制器积累大量控制经验,自发探索、主动交互、自我学习,逐步修正和完善控制策略,实现较高水平控制性能的发挥.最后,基于某航空发动机仿真平台,验证了所设计的自适应动态规划转速控制器的合理性与有效性.
-
-
赵冬斌;
刘德荣;
易建强
- 《第33期双清论坛——基于数据的控制、决策、调度与故障诊断》
| 2008年
-
摘要:
针对日益受到重视的自适应动态规划(Adaptive dynamic programming,ADP)的方法和应用进行了概述.详细分析了自适应动态规划的关键问题,如收敛性、稳定性和协调性的研究现状和趋势.介绍了城市交通信号控制问题的特点和目前采用的控制方法,以及自适应动态规划方法在街区路口和快速路入口匝道的交通信号优化控制的应用现状和前景.
-
-
Yu-Liang Liu;
刘裕良;
Yisheng Lv;
吕宜生;
Yanjie Duan;
段艳杰
- 《第七届社会计算会议》
| 2015年
-
摘要:
随着中国经济的高速增长以及城市化的稳步推进,交通设施兴建和改善的速度远远赶不上人们日益增长的交通需求,交通拥堵问题日益突出.本文研究了一种基于执行依赖启发式动态规划(Action-Dependent Heuristic Dynamic Programming,ADHDP)的交通信号控制方法,并详细描述了ADHDP的算法原理,对基于ADHDP的交通信号控制器进行了设计,阐述了控制器的离线训练和在线学习的方法.在此基础上,本文对一个有4个入口通道,每个通道有2个车道,每个入口车道均放置有车辆检测器的两相位交叉口进行了仿真实验.实验结果表明,该方法与传统的定时控制方法相比,具备在线学习的能力,能够有效提高车辆平均速度,缓解交通拥堵.
-
-
Yu-Liang Liu;
刘裕良;
Yisheng Lv;
吕宜生;
Yanjie Duan;
段艳杰
- 《第七届社会计算会议》
| 2015年
-
摘要:
随着中国经济的高速增长以及城市化的稳步推进,交通设施兴建和改善的速度远远赶不上人们日益增长的交通需求,交通拥堵问题日益突出.本文研究了一种基于执行依赖启发式动态规划(Action-Dependent Heuristic Dynamic Programming,ADHDP)的交通信号控制方法,并详细描述了ADHDP的算法原理,对基于ADHDP的交通信号控制器进行了设计,阐述了控制器的离线训练和在线学习的方法.在此基础上,本文对一个有4个入口通道,每个通道有2个车道,每个入口车道均放置有车辆检测器的两相位交叉口进行了仿真实验.实验结果表明,该方法与传统的定时控制方法相比,具备在线学习的能力,能够有效提高车辆平均速度,缓解交通拥堵.
-
-
Yu-Liang Liu;
刘裕良;
Yisheng Lv;
吕宜生;
Yanjie Duan;
段艳杰
- 《第七届社会计算会议》
| 2015年
-
摘要:
随着中国经济的高速增长以及城市化的稳步推进,交通设施兴建和改善的速度远远赶不上人们日益增长的交通需求,交通拥堵问题日益突出.本文研究了一种基于执行依赖启发式动态规划(Action-Dependent Heuristic Dynamic Programming,ADHDP)的交通信号控制方法,并详细描述了ADHDP的算法原理,对基于ADHDP的交通信号控制器进行了设计,阐述了控制器的离线训练和在线学习的方法.在此基础上,本文对一个有4个入口通道,每个通道有2个车道,每个入口车道均放置有车辆检测器的两相位交叉口进行了仿真实验.实验结果表明,该方法与传统的定时控制方法相比,具备在线学习的能力,能够有效提高车辆平均速度,缓解交通拥堵.
-
-
Yu-Liang Liu;
刘裕良;
Yisheng Lv;
吕宜生;
Yanjie Duan;
段艳杰
- 《第七届社会计算会议》
| 2015年
-
摘要:
随着中国经济的高速增长以及城市化的稳步推进,交通设施兴建和改善的速度远远赶不上人们日益增长的交通需求,交通拥堵问题日益突出.本文研究了一种基于执行依赖启发式动态规划(Action-Dependent Heuristic Dynamic Programming,ADHDP)的交通信号控制方法,并详细描述了ADHDP的算法原理,对基于ADHDP的交通信号控制器进行了设计,阐述了控制器的离线训练和在线学习的方法.在此基础上,本文对一个有4个入口通道,每个通道有2个车道,每个入口车道均放置有车辆检测器的两相位交叉口进行了仿真实验.实验结果表明,该方法与传统的定时控制方法相比,具备在线学习的能力,能够有效提高车辆平均速度,缓解交通拥堵.
-
-
-
-