首页> 中国专利> 面向连续-离散混合决策的游戏AI智能体强化学习方法

面向连续-离散混合决策的游戏AI智能体强化学习方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种面向连续‑离散混合决策的游戏AI智能体强化学习方法，首先基于现实游戏AI场景中智能体面临连续‑离散混合决策的问题，结合动作表征的学习对游戏智能体AI的连续离散动作构建出动作表征；其次，基于当前状态下的动作表征，利用深度强化学习算法进行学习；最后，将游戏AI输出的表征空间动作通过适当的方式映射回原始动作空间，从而进行正常的游戏智能体AI交互。与现有技术相比，本发明可以得到连续和离散游戏AI动作的语义关系，并且有效地提高了深度强化学习智能体的学习效率；能够让游戏AI将离散动作上或连续动作二者看成一个统一的整体，在保证合理性的同时为构建游戏AI节省了极大的时间和精力。

著录项

公开/公告号CN113869488A

专利类型发明专利
公开/公告日2021-12-31

原文格式PDF
申请/专利权人天津大学;
展开▼

申请/专利号CN202110958527.5
发明设计人李博研;汤宏垚;马亿;郝建业;郑岩;王立;
展开▼

申请日2021-08-20
分类号G06N3/04(20060101);G06N3/08(20060101);G06N20/00(20190101);
代理机构12201 天津市北洋有限责任专利代理事务所;
代理人李素兰
地址 300072 天津市南开区卫津路92号
入库时间 2023-06-19 13:29:16

法律信息

法律状态公告日

法律状态信息

法律状态
2023-10-27

发明专利申请公布后的驳回 IPC(主分类):G06N 3/04 专利申请号:2021109585275 申请公布日:20211231

发明专利申请公布后的驳回

相似文献

专利
中文文献
外文文献

1. 面向连续-离散混合决策的游戏AI智能体强化学习方法 [P] . 中国专利： CN113869488A . 2021-12-31
2. 一种分层决策的完全合作多智能体强化学习方法和系统 [P] . 中国专利： CN113780577A . 2021-12-10
3. Intelligent Decision Synchronization in Real Time for both Discrete and Continuous Process Industries [P] . 美国专利： US2019347590A1 . 2019-11-14

机译：离散和连续过程行业的实时智能决策同步
4. Intelligent Decision Synchronization in Real Time for both Discrete and Continuous Process Industries [P] . 美国专利： US2018268333A1 . 2018-09-20

机译：离散和连续过程行业的实时智能决策同步
5. Intelligent Decision Synchronization in Real Time for both Discrete and Continuous Process Industries [P] . 美国专利： US2015262095A1 . 2015-09-17

机译：离散和连续过程行业的实时智能决策同步