一种改进型Q学习算法及其在行为树中的应用

涂浩; 刘洪星

首页> 中文期刊> 《计算机应用与软件》 >一种改进型Q学习算法及其在行为树中的应用

一种改进型Q学习算法及其在行为树中的应用

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

The non-player character (NPC) in a game gains intelligence by learning,so the design of the learning algorithm becomes the key issue.In this paper,an improved Q-learning algorithm (SA-QL) was proposed.Based on simulated annealing algorithm,the Q-learning algorithm was improved in the aspects of state space,exploration strategy and reward function.Then the algorithm was applied to the design of behaviour tree,so that the NPC could learn and adjust the best execution point of the logical behaviour in the process of the game in real time,and produced the appropriate behavior response.Experimental results showed that the SA-QL algorithm was more efficient than the traditional Q-learning algorithm,and had better control effect on NPC.%游戏中的非玩家角色(NPC)通过学习获得智能,因此学习算法的设计是一个关键问题.提出一种改进型Q学习算法(SA-QL),它以模拟退火算法为基础,在状态空间、探索策略、报酬函数等方面改进了Q学习算法的不足.将该算法运用到行为树的设计中,使NPC能在游戏过程中实时学习,调整行为树中逻辑行为的最佳执行点,从而产生合适的行为响应.实验结果表明,SA-QL算法比传统Q学习算法效率更高,控制NPC的效果更好.

著录项

来源
《计算机应用与软件》 |2017年第12期|235-239|共5页
作者
涂浩; 刘洪星;
展开▼
作者单位

武汉理工大学计算机科学与技术学院;

湖北武汉430063;

武汉理工大学计算机科学与技术学院;

湖北武汉430063;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算技术、计算机技术;
关键词
游戏人工智能; 行为决策; Q学习; 行为树;

相似文献

中文文献
外文文献
专利

1. 一种新的Q学习算法在机械臂轨迹规划中的应用 [J] . 李艳辉 ,赵辉 ,李珊珊 . 吉林大学学报（信息科学版） . 2013,第001期
2. 一种改进型PSO-BP算法在红外目标中的应用 [J] . 杜珺 ,高九萍 . 火力与指挥控制 . 2020,第006期
3. 一种改进型的粒子滤波算法在运动目标跟踪中的应用 [J] . 李亚文 ,刘萌 . 舰船电子工程 . 2019,第010期
4. 一种改进型PSO算法在SVM参数寻优中的应用 [J] . 房乐楠 ,何腾鹏 ,刘宇红 . 电子科技 . 2018,第006期
5. 一种改进型控制算法在双向DC控制系统设计中的应用 [J] . 潘小刚 ,杜吉庆 . 现代制造技术与装备 . 2017,第10期
6. 一种改进型CHASE检测算法在MIMO-OFDM系统中的应用 [C] . 陈帅 ,杨铁军 ,李媚 . 第十三届全国信号处理学术年会 . 2007
7. 迁移多搜索器Q学习算法及其在电力系统中的优化应用 [A] . 唐建林 . 2020

一种改进型Q学习算法及其在行为树中的应用

摘要

著录项

相似文献

相关主题

期刊订阅