...
首页> 外文期刊>計測自動制御学会論文集 >マルチエージェントシステムのための信頼度を用いた強化学習-相補ゲームにおける競合回避行動の獲得
【24h】

マルチエージェントシステムのための信頼度を用いた強化学習-相補ゲームにおける競合回避行動の獲得

机译:多主体系统的可靠性增强学习-补充游戏中冲突避免行为的获取

获取原文
获取原文并翻译 | 示例

摘要

本研究では,マルチエージェントシステムにおける競合問題の1つとして狭路問題を取り上げ,道を譲ったエージェントが先に通過したエージェントより不利益を被る報酬の非対称性と,エージェントの知覚能力が学習性能に与える影響について取り扱う.そして,均質なエージェント群が,強化学習により道を譲るエージェントと先に通過するエージェントに分化することで,エージェント間の競合を回避できることを示す.また,信頼度を用いて強化学習の割引率を自律的に調整することで,先行研究のようにエージェント間で報酬を分配·調整することなく,従来の強化学習より高い確率で競合回避行動を獲得できることを示す.そして,競合回避行動の獲得プロセスを分析し,信頼度が競合回避行動の獲得に対し有効に作用するメカニズムを解明する.次章では本研究で取り扱う狭路問題について説明し,3章では提案手法について詳述する.4章ではシミュレーション設定と実験結果について説明し,最後にまとめと今後の課題について述べる.
机译:在这项研究中,我们将窄路问题视为多智能体系统中的竞争问题之一,而让步的智能体比先经过的智能体遭受的奖励的不对称性更大,并且智能体的感知能力会影响学习绩效。我们将处理影响。然后,我们表明,一组同质的代理可以通过区分为通过强化学习让位的代理和首先通过的代理来避免代理之间的冲突。另外,通过使用可靠性自主地调整强化学习的折现率,与传统强化学习相比,可以以更高的概率执行竞争回避行为,而无需像以前的研究那样在代理商之间分配和调整奖励。它表明它可以被获取。然后,我们分析了竞争规避行为的获取过程,并阐明了可靠性有效影响竞争规避行为的获取的机制。在下一章中,我们将解释本研究中要解决的狭窄道路问题,而在第三章中,我们将详细解释所提出的方法。第4章介绍了仿真设置和实验结果,最后总结并介绍了未来的问题。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号