...
首页> 外文期刊>計測自動制御学会論文集 >エージェント間の情報交換に基づく群強化学習法
【24h】

エージェント間の情報交換に基づく群強化学習法

机译:基于主体间信息交流的群体强化学习方法

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

強化学習とは,ある現境内におけるエージェントが現在の状態を観測し,最適な行動を決定する問題を扱う機械学習の一種である.一般の強化学習法やは,-つのエージェントがエピソードを繰り返して学習を行なう.そのため,状態数が多い場合などの複雑な学習間題に対しては,学習に時間がかかったり,最適な方策が得ら九ないことがある.一方,最適化の分野では,遺伝アルゴリズムやParticle  Swarm  Optimimtion(PSO)のように,多数の個体を用いて並列に解を更新することによって最適解を得ようとする解法が注目を集めており,これらの解法が広い探索空間を有する多峰性関数に対して短時間に最適解を発見できる能力を有していることが知られている.そこで,強化学習においても,複数のエージェントが並列に異なるエピソードを繰り返し,各エージェントが情報交換によりほかのエージェントの学習成果を参照して自分の行動価値や状態価値を良い値へ修正していけば,より優れた方策を短い学習時間で得ることができると考えられる.
机译:强化学习是一种机器学习,用于处理特定区域中的代理观察当前状态并确定最佳行为的问题。在一般强化学习方法中,一名特工重复该情节进行学习。因此,对于诸如状态很多的复杂学习问题,可能要花一些时间学习,或者可能无法获得最佳策略。另一方面,在优化领域中,试图通过使用大量个体并行更新解决方案来尝试获得最优解决方案的解决方案,例如遗传算法和粒子群优化(PSO),引起了人们的关注。众所周知,对于具有宽搜索空间的多峰函数,这些解决方案具有在短时间内找到最佳解决方案的能力。因此,即使在强化学习中,如果多个主体并行重复不同的情节,并且每个主体交换信息以参考其他主体的学习结果,并将其自身的动作值和状态值校正为良好值。 ,被认为可以在较短的学习时间内获得更好的措施。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号