首页> 外文会议>Annual Conference of the Robotics Society of Japan >マルチエージェントシステムのための信頼度を用いた強化学習-エージェントの知覚能力と競合回避行動の獲得確率の関係
【24h】

マルチエージェントシステムのための信頼度を用いた強化学習-エージェントの知覚能力と競合回避行動の獲得確率の関係

机译:利用多种代理系统的可靠性研究 - 代理感知和冲突行为的采购概率与避免行为之间的关系

获取原文

摘要

本研究では,これまでに強化学習を用いて個々のエージェントの行動を分化させることで,マルチエージェントシステムにおいて発生する競合状態を回避する方法を提案している.さらに,信頼度により強化学習の割引率を自律的に調整することで,従来の強化学習より高い確率で競合回避行動を獲得できることを示しめしている.本稿では,各エージェントが他エージェントの進行方向を正確に知覚できる場合,すなわち,隠れ状態の発生を低減させた場合,競合回避行動の獲得確率がどの程度向上するのかを分析した.その結果,エージェントの知覚能力が高い方が,競合回避行動の獲得確率が高くなる傾向があることを確認した.しかし,知覚能力を高めた場合,観測する状態数が爆発的に増加する.そのため,今後の課題として,状態空間の汎化手法の導入を検討する予定である.
机译:在这项研究中,我们提出了一种方法来避免通过区分使用增强学习的各个代理的行为来避免在多助理系统中发生的竞争条件。此外,通过自动调整可靠性的增强学习的到期速率,示出了它可以以比传统的增强学习更高的概率获取冲突避免行为。在本文中,当每个试剂可以精确地观察另一代理的行进方向时,即,当减少隐藏状态的发生时,它分析了提高了避免冲突行为的概率是多少。结果,证实代理的高概率倾向于增加获取冲突行为的可能性。但是,如果增强了感知能力,则待观察的各国数量爆炸性增加。因此,作为未来的问题,我们计划考虑引入国家空间的泛化方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号