首页> 外文OA文献 >A Reinforcement Learning Method with the Inference of the Other Agent's Policy for 2-Player Stochastic Games
【2h】

A Reinforcement Learning Method with the Inference of the Other Agent's Policy for 2-Player Stochastic Games

机译:一种基于二人随机游戏对方代理策略的强化学习方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

本論文では,2体エージェント確率ゲームにおける新たな強化学習法を提案する.提案する手法では,他エージェントが実際に実行した行動の観測情報をもとに他エージェントの政策(行動決定関数)を推定し,その推定した政策を利用して他エージェントが未来に実行する行動を予測する.そして,その予測行動を利用しながら強化学習を進行する.提案した手法を2体エージェント確率ゲームの枠組みでモデル化した追跡問題に適用し,実験を行い,提案手法の有効性を示す.
机译:在本文中,我们提出了一种新的用于两人随机游戏的强化学习方法。在提出的方法中,基于另一代理实际执行的动作的观察信息来估计另一代理的策略(动作决定功能),并且通过使用所估计的策略来估计另一代理将来执行的动作。预测。然后,在利用预测行为的同时进行强化学习。将所提方法应用于在两人随机博弈框架下建模的跟踪问题,进行了实验,证明了所提方法的有效性。

著录项

  • 作者

    長行 康男; 伊藤 実;

  • 作者单位
  • 年度 2003
  • 总页数
  • 原文格式 PDF
  • 正文语种 ja
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号