首页> 外文会议>インテリジェント·システム·シンポジウム >マルチエージェント強化学習における割引率の社会適応的調節-生物に見られる社会的階層構造の自己組織化と神経修飾物質
【24h】

マルチエージェント強化学習における割引率の社会適応的調節-生物に見られる社会的階層構造の自己組織化と神経修飾物質

机译:社会适应性调整贴现率的多功能增强学习 - 社会等级结构的自我组装,充满英里和神经调制

获取原文

摘要

本研究では社会的相互作用と神経修飾物質の関係に関する生物学的知見に基づき,マルチエージェントメタ学習を構築する.また本稿では,本手法がエージェント数の増減に対して高いロバスト性·拡張性をもつことを示す.より具体的には,(i) 競争的な相互作用によって,社会に所属している個体ごとに異なる割引率が割り当てられる現象を用い(2.1~2.3 節)(ii) 複数の割引率の中から信頼度の高い割引率を選び出す手法と組みあわせる(2.4 節).2.4 節に引用する研究はシングルプロセッサを前提としたアルゴリズムである.本研究ではこれをマルチプロセッサ·マルチエージェント用途へ拡張し,プロセッサ毎に異なる割引率を割り当て,信頼度の高いエージェントを選び出すアルゴリズムに変形する.本研究の特色として,上記(i)の自己組織化現象を利用していることで,各プロセッサに割引率を割り当てる際,初期値に依存しない設定が可能となっている.これによりプロセッサの交換や追加などに際して高いロバスト性·拡張性を持つシステムが構築可能である.このことに関しては,5 章で改めて検討する.
机译:在这项研究中,我们基于关于社会互动和神经调节剂的生物学发现构建了多代理元学习。在本文中,我们表明该方法具有高稳健性和可扩展性,可增加或减少代理人数。更具体地说,(i)使用,其中不同的折扣率被分配给谁属于社会(ii)从多个贴现率(II)与选择一个可靠的贴现率(2.4节)的方法,包括每个独立的现象。第2.4节中引用的研究是一种基于单个处理器的算法。在这项研究中,因此,可以扩展到多处理器的多代理应用程序和变换为每个处理器和变换不同的贴现率成一种算法,选择可靠性高的试剂。作为本研究的特征,当使用上述(i)的自组织现象时,在将折扣率分配给每个处理器时,可以设置初始值独立值。这可以在更换或添加处理器时构建具有高稳健性和可伸缩性的系统。这将在第5章中再次讨论。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号