基于参考模型的输出反馈强化学习控制

郝钏钏; 方舟; 李平

首页> 中文期刊> 《浙江大学学报：工学版》 >基于参考模型的输出反馈强化学习控制

基于参考模型的输出反馈强化学习控制

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

现有的直接策略搜索强化学习控制算法大多是状态完全可观对象设计状态反馈控制策略,其适用的对象范围十分有限.为此,提出一种适用范围更广的模型参考输出反馈强化学习控制算法,其学习过程仅依赖对象输出,并可以获得使闭环系统具有期望动态性能的输出反馈控制策略.算法构造了以参考模型为基础的回报函数,可以有效地描述系统的期望闭环动态性能;采用以PID输出反馈控制律为基础的参数化随机控制策略,以便于利用先验知识、依据控制领域常用的PID参数经验整定方法确定较好的初始策略,以缩短学习时间;并使用具有良好学习性能的eNAC算法进行控制策略优化.二阶开环不稳定对象和某型高亚音速无人机俯仰通道线性参变(LPV)模型的学习控制仿真结果验证了算法的有效性.

著录项

来源
《浙江大学学报：工学版》 |2013年第3期|409-414|共7页
作者
郝钏钏; 方舟; 李平;
展开▼
作者单位

浙江大学控制科学与工程学系;

浙江大学航空航天学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工智能理论;
关键词
强化学习控制; 回报函数构造; eNAC算法; 输出反馈控制策略;

相似文献

中文文献
外文文献
专利

1. 基于2维性能参考模型的2维模型预测迭代学习控制策略 [J] . 师佳 ,江青茵 ,曹志凯 . 自动化学报 . 2013,第005期
2. 全柔性空间机器人基于虚拟力的输出反馈有限维重复学习控制及振动抑制 [J] . 付晓东 ,陈力 . 空间科学学报 . 2021,第005期
3. 利用参考模型输出反馈构成的混合自适应控制方案 [J] . 张秀玲 ,徐国凯 . 东北重型机械学院学报 . 1997,第003期
4. 2-D系统H∞输出反馈迭代学习控制器设计 [J] . 刘丛志 ,王铃燕 ,刘伟群 . 计算机应用 . 2016,第0z2期
5. 具有未知控制方向的输出反馈自适应学习控制 [J] . 于淼 ,王佳森 ,齐冬莲 . 浙江大学学报（工学版） . 2013,第008期
6. 模糊参考模型学习控制及其在电炉炼钢中的应用 [C] . 张振东 ,孙增圻 . 1998年中国智能自动化学术会议 . 1998
7. 基于积分强化学习的输出反馈跟踪控制方法研究 [A] . 孟晴晴 . 2020

基于参考模型的输出反馈强化学习控制

摘要

著录项

相似文献

相关主题

期刊订阅