基于深度强化学习的视频游戏决策模型研究与应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网的不断深入发展以及手机等各种电子设备的不断普及，游戏已经成了人们生活中的很重要的一部分。人们通过游戏认识了不同的人，游戏也成为了人们休闲时的一种消遣方式。游戏产业也迎来了高速发展，如何为游戏玩家提供差异化的游戏体验则成为了重中之重。随着机器学习的不断研究与发展，基于深度学习与强化学习的深度强化学习为研究人员在游戏中使用机器学习方法提供了解决思路。本文从深度强化学习出发，研究机器学习是如何在游戏中应用的，主要工作如下： ⑴本文介绍了深度强化学习在国内外的发展状况，对游戏中用到的深度强化学习算法进行整理，并对这些算法进行原理解析，对其中核心技术进行解析。 ⑵本文研究了深度学习与强化学习。强化学习是用来解决探索与决策问题的有效方法，但是强化学习在处理高维度的数据时存在着挑战性，所以使用深度学习中的神经网络来处理高维度的感知数据(比如，视频，语音等)，提取特征作为强化学习的输入。其中深度卷积神经网络在处理图像上有着天然的优势，该网络非常善于检测特征，但是对于特征变体的检测效率却不理想，所以本文使用胶囊网络代替卷积网络来处理感知数据。Q-learning是一种经典的强化学习方法，它的核心是通过不断与环境进行交互、试错、获得反馈来逐步逼近最优策略。 ⑶本文研究了深度强化学习。谷歌公司的人工智能团队提出了结合深度学习与强化学习的深度强化学习算法，成功的应用在Atari游戏环境中，并且取得了惊人的成绩。但是该算法存在着探索效率不高的问题。本文使用改进的Bootstrapped DQN方法来提高探索时的效率。 ⑷本文设计了一个结合胶囊网络与Bootstrapped DQN方法的视频游戏决策模型。通过使用胶囊网络替代卷积神经网络，提高本文模型检测特征变体的能力；使用Bootstrapped DQN方法来提高本文模型的训练速度与深度探索的能力。本文设计了一个结合胶囊网络与Bootstrapped DQN方法的视频游戏决策模型。该游戏决策模型使用胶囊网络来感知高维度输入数据并提取特征，胶囊网络不仅可以检测特征，还可以检测特征变体，提高了提取图像识别的效率。另外使用Bootstrapped DQN方法来进行深度探索，加快模型探索策略时的效率。通过实验分析与对比，得出本文游戏决策模型可以成功的学习到控制策略并且提高了探索策略时的效率的结论。

著录项

作者
郭勤;
展开▼
作者单位

江西理工大学;

展开▼
授予单位江西理工大学;
学科计算机技术
授予学位硕士
导师姓名黄学雨;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;自动化基础理论;
关键词
强化学习; 视频游戏; 决策模型;

相似文献

中文文献
外文文献
专利

1. 深度强化学习在Atari视频游戏上的应用 [J] . 石征锦 ,王康 . 电子世界 . 2017,第016期
2. 基于深度强化学习的智能机器人避障决策模型 [J] . 凌涛 . 新乡学院学报（自然科学版） . 2021,第003期
3. 基于深度强化学习的智能机器人避障决策模型 [J] . 凌涛 . 新乡学院学报：自然科学版 . 2021,第003期
4. 基于元深度强化学习方法的智能博弈决策模型研究 [J] . 徐志雄 ,曹雷 ,陈希亮 . 军事运筹与系统工程 . 2021,第003期
5. 基于深度强化学习的无人机辅助弹性视频多播机制 [J] . 成昭炜 ,沈航 ,汪悦 . 计算机科学 . 2021,第009期
6. 以游戏视频为例论游戏软件著作权的反垄断规制 [C] . 段菲 . 2016年广东省研究生学术论坛经济法分论坛 . 2016
7. 基于深度强化学习的视频游戏模拟算法研究 [A] . 许江涛 . 2019

基于深度强化学习的视频游戏决策模型研究与应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅