基于Q学习的有限时间随机线性二次最优控制

王涛; 罗敏娜; 王娜; 崔黎黎

首页> 中文期刊> 《沈阳师范大学学报（自然科学版）》 >基于Q学习的有限时间随机线性二次最优控制

基于Q学习的有限时间随机线性二次最优控制

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

cqvip:针对系统状态和控制均依赖于噪声的随机线性离散时间系统,采用基于值迭代的Q学习迭代算法求解模型参数部分未知的有限时间随机线性二次(SLQ)最优控制问题。首先给出SLQ最优控制问题可达性条件和适应性条件,并通过矩阵拉格朗日乘子算法得到最优控制增益矩阵序列以及相应的随机代数Riccati方程(SARE)。其次,以值迭代算法为基础定义Q函数,利用Q学习迭代算法获得每个最优控制增益矩阵所对应的迭代控制增益矩阵序列和H矩阵序列。该算法依赖于系统状态信息,摆脱了系统模型参数部分未知的限制,并证明控制增益矩阵序列收敛到各自的最优控制增益矩阵,H矩阵序列收敛到各自的最优H矩阵。最后通过一个仿真实例说明了Q学习迭代算法的有效性。

著录项

来源
《沈阳师范大学学报（自然科学版）》 |2020年第3期|207-213|共7页
作者
王涛; 罗敏娜; 王娜; 崔黎黎;
展开▼
作者单位

沈阳师范大学计算机与数学基础教学部沈阳 110034;

沈阳师范大学软件学院沈阳110034;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP273.1;
关键词
Q学习; 最优控制; 随机代数Riccati方程; 控制增益矩阵;

相似文献

中文文献
外文文献
专利

1. 基于Q学习算法的随机离散时间系统的随机线性二次最优追踪控制 [J] . 张正义 ,赵学艳 . 南京信息工程大学学报 . 2021,第005期
2. 正倒向随机微分方程与一类线性二次随机最优控制问题 [J] . 王向荣 ,高自友 ,吴臻 . 自动化学报 . 2003,第001期
3. 带有随机跳跃干扰的线性二次随机最优控制问题 [J] . 吴臻 ,王向荣 . 自动化学报 . 2003,第006期
4. 由Lévy过程驱动的随机线性二次最优控制问题 [J] . 武灿文 ,唐矛宁 . 湖州师范学院学报 . 2021,第008期
5. 考虑组合风险的指数化投资与随机线性二次最优控制 [J] . 李院德 ,陈启宏 . 运筹与管理 . 2020,第002期
6. 有限时间信息融合线性二次型最优控制 [C] . 甄子洋 ,江驹 ,王志胜 . 第二十二届中国过程控制会议 . 2011
7. 线性随机系统的随机精确能控性及线性二次最优控制（LQ）在投资组合中的应用 [A] . 李宏杰 . 2002

基于Q学习的有限时间随机线性二次最优控制

摘要

著录项

相似文献

相关主题

期刊订阅