基于ADP算法的随机离散线性二次最优控制问题的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着现代科学技术的快速发展,工业生产过程变得异常复杂.受不确定性、强非线性和多变量等因素的影响,很难用精确的数学模型描述系统的动态特性,从而对研究最优控制问题造成了极大的困难.因此,未知系统下的最优控制问题成为研究热点.本文提出基于神经网络的自适应动态规划(Adaptive/Approximate Dynamic Programming,ADP)算法研究未知随机离散系统在无限时域的线性二次型(Linear Quadratic,LQ)最优控制问题.具体研究内容如下:
　　一、研究了未知平均场随机离散系统下在无限时域的LQ最优控制问题.首先,将黎卡提(Riccati)方程推广到广义的Riccati方程组,状态反馈增益矩阵扩展为增益矩阵对,给出了平均场系统的LQ最优控制存在的充分条件.然后,将随机系统转化为确定性系统,提出一种值迭代的ADP算法并进行了收敛性分析.同时,用反向传播(Back Propagation,BP)神经网络设计模型网络、评价网络和执行网络来分别估计未知的系统模型、目标函数、控制增益矩阵对.最后,通过系统仿真验证了ADP方法的有效性.
　　二、解决了未知的斯坦克尔伯格博弈随机离散系统下的无限时间LQ最优策略问题.首先,把随机系统转化为确定性系统,给出最优策略的存在的充分条件.然后,在满足纳什均衡的条件下,提出ADP算法,构造迭代方程,构造迭代方程时要考虑决策者和跟随者的相互作用,迭代方程的结构特点要求和目标函数的结构特点保持一致,并且迭代方程的个数与决策者和跟随者的个数密切相关,并进行收敛性分析.同时,用BP神经网络设计启发式动态规划(Heuristic Dynamic Programming,HDP)控制器并且通过训练模型网络、评价网络、执行网络分别估计动态系统状态、目标函数、最优策略集.最后,通过仿真实验验证算法的有效性.

著录项

作者
刘蕊蕊;
展开▼
作者单位

山东科技大学;

展开▼
授予单位山东科技大学;
学科应用数学
授予学位硕士
导师姓名刘西奎;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类最优控制;
关键词
最优控制; 线性二次型; 自适应动态规划算法; 未知随机离散系统; 无限时域;

相似文献

中文文献
外文文献
专利

1. 基于Q学习算法的随机离散时间系统的随机线性二次最优追踪控制 [J] . 张正义 ,赵学艳 . 南京信息工程大学学报 . 2021,第005期
2. 正倒向随机微分方程与一类线性二次随机最优控制问题 [J] . 王向荣 ,高自友 ,吴臻 . 自动化学报 . 2003,第001期
3. 带有随机跳跃干扰的线性二次随机最优控制问题 [J] . 吴臻 ,王向荣 . 自动化学报 . 2003,第006期
4. 离散时间平均场不定线性二次最优控制问题 [J] . 于合谣 ,刘蕊蕊 ,冀鹏飞 . 滨州学院学报 . 2017,第002期
5. 由Lévy过程驱动的随机线性二次最优控制问题 [J] . 武灿文 ,唐矛宁 . 湖州师范学院学报 . 2021,第008期
6. 离散双线性动态系统二次型最优控制的迭代算法 [C] . 李俊民 ,孙云平 ,刘赟 . 2005中国控制与决策学术年会 . 2005
7. 由Levy过程驱动的随机线性二次最优控制问题及含Markov链的倒向随机微分方程 [A] . 唐怀宾 . 2008

基于ADP算法的随机离散线性二次最优控制问题的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅