首页> 外文会议>SICE Symposium on Systems and Information;システム·情報部門学術講演会 >あるクラスのジレンマ問題に対する期待方策強化学習法
【24h】

あるクラスのジレンマ問題に対する期待方策強化学習法

机译:阶级困境问题的预期措施

获取原文

摘要

本論文では、確率ゲームによって記述されるジレンマ問題に対して最適な方策を得る強化学習手法を提案する。我々は先に、全てのエージェントが他のエージェントにより良い方策を期待する学習手法を提案しており、これを期待方策強化学習法と呼hでいる。この期待すべき方策を求めるためには状態行動組空間の十分な探査が必要であるが、先の手法では探査に多大な時間を必要としていた。本論文ではこの探査部分を効率化した期待方策強化学習法を提案することで、より広いクラスの問題に対応できるようにしている。
机译:在本文中,我们提出了一种加强学习方法,其获得了概率游戏描述的困境问题的最佳策略。 我们提出了一种学习方法,即所有代理商都希望对其他代理商的良好策略,以及预期的政策加强学习方法并致电H。 为了找到预期的措施,需要足够的探索状态行为设定空间,但是在以前的方法中,我们需要大量的探索时间。 在本文中,我们通过提出更有效的这一调查部分的预期政策加强学习方法提出了更广泛的课堂问题。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号