首页> 外文期刊>電子情報通信学会論文誌, D. 情報·システム >マルチエージェントシステムにおける行動制御- PSOにおける重み係数の強化学習-
【24h】

マルチエージェントシステムにおける行動制御- PSOにおける重み係数の強化学習-

机译:多主体系统中的行为控制-加强PSO中加权系数的学习-

获取原文
获取原文并翻译 | 示例
           

摘要

マルチエージェント学習には方策こう配法を用いた自律分散型の強化学習が有効である.この応用例として,本論文ではPSOによる連続関数の最小値探索問題への適用を試みた.PSOでは各粒子の速度を決定する運動方程式の中に,それまでに発見された自己べストとグループべストの地点への引力の強さを表す重み係数が含まれている.通常,これらの重み係数はシステム作成者が全粒子に対して一律の固定値を与える.本研究では,PSOの探索モデルをべースに方策こう配法が適用可能な新たな探索モデルを提案する.本 探索モデルにおいては,重み係数は一律である必要はなく,粒子ごとに異なる値をとることが可能である.これは粒子に個性をもたせることに相当する.また,引力だけではなく斥力を考慮することも可能となる学.習により得られ係た数重の評価実験として,7種類のテスト関数を用いたべンチマークテストを行った.その結果から本探索モデルにおける学習能力の有効性を確認することができた.
机译:使用策略梯度方法的自主分散强化学习对于多主体学习是有效的。作为一个应用实例,在本文中,我们尝试将连续函数应用于PSO的最小值搜索问题。在PSO中,确定每个粒子速度的动力学方程式包含一个加权系数,该系数表示到目前为止所发现的自最佳和最佳组的吸引力的强度。通常,系统创建者会为所有粒子赋予这些权重系数统一的固定值。在这项研究中,我们提出了一种新的搜索模型,可以基于PSO的搜索模型将策略梯度方法应用于该搜索模型。在此搜索模型中,加权系数不必统一,并且可以为每个粒子采用不同的值。这等效于赋予粒子个性。另外,不仅可以考虑吸引力,而且可以考虑排斥力。作为通过学习获得的多层评估实验,我们使用七种测试功能进行了基准测试。从结果中,我们能够确认这种搜索模型中学习能力的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号