首页> 外文会议>システム研究会 >部分観測マルコフ決定問題に対する群強化学習法: Swarm HQ-Learning
【24h】

部分観測マルコフ決定問題に対する群強化学習法: Swarm HQ-Learning

机译:局部观测马尔可夫决策问题的群强化学习方法:群体HQ学习

获取原文

摘要

近年,強化学習の研究が盛hに行われている。強化学習は「報酬」という特別な情報を手掛かりにェージェントが試行錯誤を通じて制御則を獲得する機械学習の一種である。強化学習の最大の特徴は,不確実性のある環境,報酬に遅れが存在する環境にも適応可能なところにある。
机译:近年来,关于强化学习的研究已经积极开展。强化学习是一种机器学习,其中代理使用称为“奖励”的特殊信息通过试验和错误来获取控制规则。强化学习的最大特点是,它可以适应不确定的环境和奖励被延迟的环境。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号