首页> 外文期刊>人工知能学会論文誌 >マルチエージェント連続タスクにおける報酬設計の実験的考察-RoboCup Soccer Keepaway タスクを例として
【24h】

マルチエージェント連続タスクにおける報酬設計の実験的考察-RoboCup Soccer Keepaway タスクを例として

机译:多Agent连续任务中奖励设计的实验考虑-以RoboCup足球禁忌任务为例

获取原文
获取原文并翻译 | 示例
           

摘要

本論文では,keepawayにおける従来の報酬設計の問題点を,いくつかの実験を通じて指摘し,これに代わる報酬設計法を提案する.また,提案手法によってボールキープ時間が大幅に改善される理由を考察し,マルチエージェント連続タスクの報酬設計法の指針を与えることを目的とする.以下,第2章では,keepawayの問題設定と,強化学習を適用する際の問題の特徴を述べる.第3章では,keepawayを例として,マルチエージェント系における連続タスクにおいて考慮すべき報酬設計問題を列挙し,このタイプのタスクに適した報酬設計を提案する.第4章では実験方法,および,提案した報酬設計法と従来法による性能を,キープ時間の長さと獲得された行動の側面から比較する.また,5章では提案手法の妥当性を考察し,本タスクにおける報酬設計指針をまとめる.最後に第6章で結論と今後の課題を述べる.
机译:本文通过一些实验指出了传统的奖励设计存在的问题,并提出了一种替代的奖励设计方法。本研究的目的是考虑提出的方法显着改善控球时间的原因,并为多主体连续任务的奖励设计方法提供指导。在第2章中,我们描述了强化学习的问题设置以及应用强化学习时问题的特征。在第3章中,以保持距离为例,我们列出了多智能体系统中连续任务要考虑的奖励设计问题,并提出了适合此类任务的奖励设计。第四章从保持时间的长短和获得的行为两个方面比较了实验方法和所提出的奖励设计方法与常规方法的性能。在第5章中,我们考虑了所提出方法的有效性,并总结了该任务的奖励设计准则。最后,第6章介绍了结论和未来的问题。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号