首页> 外文会议>SICE Symposium on Systems and Information >衝突回避ゲームにおけるコミュニケーション創発現象の解析のためのQ学習およびNeural-Q学習エージェントの性能比較
【24h】

衝突回避ゲームにおけるコミュニケーション創発現象の解析のためのQ学習およびNeural-Q学習エージェントの性能比較

机译:Q学习避免碰撞避免游戏通信排放现象的分析,避免游戏术语性能的比较

获取原文

摘要

現在我々が行っているコミュニケーションがどのようにして創発し複雑化してきたのかという疑問に対し,本研究では,他者との相互作用と行動学習を通じて目的を持った「動作」がコミュニケーション上の「記号」として用いられることでコミュニケーションを成立させられるようになったという仮説を立て,仮説の検証,およびこの創発現象の解析に適するエージェントの要件を検討することを目的として,衝突回避ゲームを通じて,Q学習と,Q学習とニューラルネットワークを組み合わせたモデルであるNeural-Q学習エージェントの性能について比較を行った.その結果,衝突回避能力はQ学習エージェント,そして,ゴール到達能力はNeural-Q学習エージェントが優れていることがわかった.また,Neural-Q学習においては,メモリサイズ1のエージェントが衝突回避·ゴール到達両方で最も高い性能を示した.そして,各エージェントの特性より,衝突回避,およびゴール到達性能の向上に必要な要件を検討し,Neural-Q学習エージェントにおいてニューラルネットワークをフィードフォワード型からリカレント型へと変更することで時系列データを扱えるように拡張することが,本研究の仮説の検証,およびコミュニケーションの創発現象の解析には適しているのではないかという結論を得た.
机译:在如何我们正在做的通信和通信已组织和复杂的问题,在这项研究中,“操作”通过与他人和行为学习的互动为目的“作为一个符号,一个假设,即建立通信,并通过碰撞避免游戏,用验证假设和适合的这个发射现象分析试剂的目的,神经-Q的学习表现剂,这是一种模型组合学习,Q学习和神经网络,进行了比较。其结果是,发现的防撞能力是Q学习剂,并能达到的目标是极好的神经-Q学习代理商。此外,在神经-Q学习,内存大小1的代理人表示既避免碰撞和目标达到最高性能。然后,从每个代理的特点,我们认为有必要避免碰撞和目标可达性能改进的要求,并通过改变神经-Q学习剂的神经网络改变来自前馈式复发型神经网络。扩展处理它的结论是,它适用于本研究的假设和通信的出现现象分析的验证。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号