Q-learning强化学习算法改进及其应用研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

由于强化学习不需要教师信号，能在与环境的交互过程中不断地完善自己的认知技能，因此对于求解复杂的控制与决策问题具有更广泛的应用前景。课题选用强化学习算法中经典的Q-Learning算法，并结合不同的控制对象为实验模型，在已有强化学习算法的基础上加以改进，将Q-learning算法中的状态模糊化。此外结合神经网络，提出了自己的研究模型和见解。将这些改进应用到走迷宫寻优、倒立摆系统控制、中和反应控制及电梯群控器的调度中。主要研究成果包括以下四个方面： 1、介绍一级倒立摆系统。提出了基于Q-learning强化学习算法对倒立摆的控制。由于学习系统仅有4个离散的控制动作，控制精度比较差。鉴于上述缺陷，提出Fuzzy-Q学习实现倒立摆控制，使得控制器的输出为连续信号，有效的提高了控制精度。 2、将Q学习和多步Q学习的算法应用到走迷宫路径寻优中，并对Q学习算法的参数进行比较分析。 3、以中和反应控制为例，将强化学习算法渗透到生物、化学工业学科领域中。为该领域的发展提出一个新的研究方向。 4、首先，阐述电梯群组调度基本概念。总结现有的电梯群组调度方法。其次，将神经网络与Q学习算法结合应用到电梯群组调度问题。

著录项

作者
褚建华;
展开▼
作者单位

北京化工大学;

展开▼
授予单位北京化工大学;
学科控制理论与控制工程
授予学位硕士
导师姓名李大字;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;电梯工程;
关键词
强化学习算法; 走迷宫寻优; 倒立摆系统; 中和反应控制; 电梯群控器;

相似文献

中文文献
外文文献
专利

1. Q-learning强化学习制导律 [J] . 张秦浩 ,敖百强 ,张秦雪 . 系统工程与电子技术 . 2020,第002期
2. 无线网络中基于强化学习的拥塞控制算法改进 [J] . 罗颖 ,林茂松 ,江虹 . 自动化仪表 . 2014,第006期
3. 基于改进Q-learning的移动机器人路径规划应用研究 [J] . 彭玲玲 ,刘凯 . 中国储运 . 2019,第008期
4. Q-learning算法的应用研究 [J] . 王国庆 . 河北企业 . 2016,第012期
5. 深度强化学习在物联网边缘计算中的应用研究 [J] . 殷耀文 . 信息技术 . 2021,第001期
6. 基于Q-Learning的无人船智能避碰决策 [C] . 孙静海 . 大连海事大学第七届硕博论坛 . 2018
7. 特定路网环境下基于强化学习的运动协调算法改进研究 [A] . 郝秀召 . 2020

Q-learning强化学习算法改进及其应用研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅