首页> 外文会议>ツステム制御情報学会研究発表講演会 >寿命のある自己最良値を用いたParticle Swarm Optimization に基づく群強化学習法
【24h】

寿命のある自己最良値を用いたParticle Swarm Optimization に基づく群強化学習法

机译:基于粒子群优化使用寿命自我DipRote的组加强学习方法

获取原文

摘要

PSO の更新式を用いた情報交換法では,各エージェントの価値の良し悪しを何らかの方法で評価し,各エージェントがこれまでに発見した最良の価値(自己最良価値)と全エージェントがこれまでに発見した最良価値(全体最良価値)を用いて各エージェントの価値を更新する.しかし,価値の評価は必ずしも適切に行われるとは限らないために,価値が過大評価されることがあり,そのような過大評価された最良価値によって学習速度が低下すると考えられる.そこで,自己最良価値に寿命を設定し,寿命分のエピソードが経過したときは自己最良価値を現在の価値で置き換える方法を提案し,最短経路問題に適用した結果を示した.提案方法の性能は自己最良価値がどの程度過大評価されているかに依存すると考えられるが,これまでにそのような考察は行われていない.そこで,本稿では,最短経路問題における過大評価の大きさを調べ,提案方法の性能を評価する.
机译:在使用PSO更新表达式的信息Exchange方法中,以某种方式评估每个代理的良好值,到目前为止发现每个代理商(自最佳价值),并且到目前为止发现所有代理商使用最佳的代理更新每个代理的值价值(总体最佳值)。然而,价值评估不一定​​正确完成,并且值高估,并且认为由于这种最佳值的过度值,学习速度降低。因此,当寿命被设定为自最佳值时,并且当经过寿命定义的剧集时,一种替换当前值的自最佳值的方法,并显示了应用于最短路径问题的结果。虽然所提出的方法的性能取决于自我最佳价值高估了多少,但到目前为止还没有进行这种考虑。因此,在本文中,我们在最短路径问题中检查过度评估的大小,并评估所提出的方法的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号