首页> 中文学位 >基于强化学习的动作控制与决策研究

【6h】

基于强化学习的动作控制与决策研究

代理获取

页面导航

目录
著录项
相似文献
相关主题

目录

声明

第一章绪论

1.1 研究背景与意义

1.2.1 国外研究现状

1.2.2 国内研究现状

1.3 本文研究工作

第二章强化学习基础研究

2.1机器学习简述

2.2强化学习基本原理及系统组成

2.2.1强化学习系统组成

2.2.2马尔科夫决策过程

第三章强化学习算法与改进的强化学习算法

3.1模型已知的强化学习算法

3.1.1 策略迭代算法（Policy Interation Method）

3.1.2价值迭代算法（Value Iteration Method）

3.2模型未知的强化学习算法

3.2.1蒙特卡洛算法（Monte Carlo Method）

3.2.2 时序差分算法（Temporal-Difference Learning）

3.2.3 SARSA 算法

3.2.4 Q-Learning算法

3.2.5 DQN算法

3.3基于Q-Learning与DQN的改进算法

3.3.1基于Q-Learning的动作控制改进算法

3.3.2基于DQN的动作控制改进算法

第四章实验设计与结果分析

4.1实验设计

4.2.1 Open AI与Gym

4.2.2 ALE与Atari 2600

4.2.3实验环境预处理

4.3实验结果分析

4.3.1改进算法的实验分析

4.3.2 与不同算法的对比实验

4.4实验总结与展望

第五章总结与展望

5.1总结

5.2展望

致谢

参考文献

攻读学位期间参加科研项目情况及获得的学术成果

展开▼

著录项

作者
徐娟;
展开▼
作者单位

西安石油大学;

展开▼
授予单位西安石油大学;
学科控制工程
授予学位硕士
导师姓名穆向阳;
年度 2020
页码
总页数
原文格式 PDF
正文语种 chi
中图分类 TP3TP2;
关键词

相似文献

中文文献
外文文献
专利

1. 基于强化学习的腿式机器人运动控制与决策研究 [J] . 侯远韶 . 科技创新导报 . 2021,第003期
2. 基于深度强化学习潜艇攻防对抗训练指挥决策研究 [J] . 郭洪宇 ,初阳 ,刘志 . 指挥控制与仿真 . 2022,第1期
3. 基于深度强化学习的航天信息综合应用与决策研究 [J] . 王港 ,帅通 ,陈金勇 . 无线电工程 . 2019,第007期
4. 基于强化学习的锚泊辅助动力定位系统智能决策研究 [J] . 余尚禹 ,王磊 ,李博 . 海洋工程 . 2019,第6期
5. 基于深度强化学习的作战辅助决策研究 [J] . 周来 ,靳晓伟 ,郑益凯 . 空天防御 . 2018,第001期
6. 基于强化学习的转台控制参数自整定方法研究 [C] . ZHANG Qi-chen ,张祺深 ,YE Ming . 第十五届中国航空测控技术年会 . 2018
7. 基于避碰规则与强化学习的船舶智能避碰决策研究 [A] . 冯涂超 . 2020

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号