首页> 外文会议>システム研究会 >部分観測マルコフ決定問題に対する群強化学習法: Swarm HQ-Learning

【24h】

部分観測マルコフ決定問題に対する群強化学習法: Swarm HQ-Learning

机译：局部观测马尔可夫决策问题的群强化学习方法：群体HQ学习

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

近年，強化学習の研究が盛hに行われている。強化学習は「報酬」という特別な情報を手掛かりにェージェントが試行錯誤を通じて制御則を獲得する機械学習の一種である。強化学習の最大の特徴は，不確実性のある環境，報酬に遅れが存在する環境にも適応可能なところにある。

机译：近年来，关于强化学习的研究已经积极开展。强化学习是一种机器学习，其中代理使用称为“奖励”的特殊信息通过试验和错误来获取控制规则。强化学习的最大特点是，它可以适应不确定的环境和奖励被延迟的环境。

著录项

来源
《システム研究会》|2018年|63-68|共6页
会议地点
作者
竹内健也; 黒江康明; 前田裕;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
強化学習; 部分観測マルコフ決定過程; hq学習; 群強化学習;

机译：强化学习; 部分観测マルコフ决定过程; hq学习; 群强化学习;

相似文献

外文文献
中文文献
专利

1. 強化学習の最近の発展第4回：部分観測マルコフ決定過程と強化学習 [J] . 澁谷長史计测と制御 . 2013,第4期

机译：强化学习的最新进展第4部分：部分观察马尔可夫决策过程和强化学习
2. 強化学習の最近の発展第4回：部分観測マルコフ決定過程と強化学習 [J] . 澁谷長史计测と制御 . 2013,第4期

机译：钢筋最近的发展第四次：部分观察马尔可夫确定过程和加固学习
3. マルチエージェントタスクに対する群強化学習法－ジレンマ問題の解法 [J] . 山分翔太, 黒江康明, 飯間等計測自動制御学会論文集 . 2013,第3期

机译：解决多主体任务难题的群体增强学习方法
4. 部分観測マルコフ決定問題に対する群強化学習法: Swarm HQ-Learning [C] . 竹内健也, 黒江康明, 前田裕システム·情報部門学術講演会 . 2018

机译：部分观察Markov决策问题的子评价学习方法：群体总部学习
5. 音響放射圧法による超音波強度の絶対測定に関する研究 [D] . 長谷川, 高陽 -1

机译：声辐射压力法绝对测量超声强度的研究
6. 部分観測環境における強化学習とアンサンブル学習法に関する研究 [O] . 末松伸朗, スエマツノブオ 2017

机译：部分观察环境下的强化学习与整体学习研究

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号