エージェント間の情報交換に基づく群強化学習法

飯間等; 黒江康明; Hitoshi IiMA; Yasuaki KUROE

首页> 外文期刊>計測自動制御学会論文集 >エージェント間の情報交換に基づく群強化学習法

【24h】

エージェント間の情報交換に基づく群強化学習法

机译：基于主体间信息交流的群体强化学习方法

获取原文

获取原文并翻译 | 示例

获取外文期刊封面封底 >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

強化学習とは，ある現境内におけるエージェントが現在の状態を観測し，最適な行動を決定する問題を扱う機械学習の一種である．一般の強化学習法やは，－つのエージェントがエピソードを繰り返して学習を行なう．そのため，状態数が多い場合などの複雑な学習間題に対しては，学習に時間がかかったり，最適な方策が得ら九ないことがある．一方，最適化の分野では，遺伝アルゴリズムやParticle　 Swarm　 Optimimtion（PSO）のように，多数の個体を用いて並列に解を更新することによって最適解を得ようとする解法が注目を集めており，これらの解法が広い探索空間を有する多峰性関数に対して短時間に最適解を発見できる能力を有していることが知られている．そこで，強化学習においても，複数のエージェントが並列に異なるエピソードを繰り返し，各エージェントが情報交換によりほかのエージェントの学習成果を参照して自分の行動価値や状態価値を良い値へ修正していけば，より優れた方策を短い学習時間で得ることができると考えられる.

机译：强化学习是一种机器学习，用于处理特定区域中的代理观察当前状态并确定最佳行为的问题。在一般强化学习方法中，一名特工重复该情节进行学习。因此，对于诸如状态很多的复杂学习问题，可能要花一些时间学习，或者可能无法获得最佳策略。另一方面，在优化领域中，试图通过使用大量个体并行更新解决方案来尝试获得最优解决方案的解决方案，例如遗传算法和粒子群优化（PSO），引起了人们的关注。众所周知，对于具有宽搜索空间的多峰函数，这些解决方案具有在短时间内找到最佳解决方案的能力。因此，即使在强化学习中，如果多个主体并行重复不同的情节，并且每个主体交换信息以参考其他主体的学习结果，并将其自身的动作值和状态值校正为良好值。，被认为可以在较短的学习时间内获得更好的措施。

著录项

来源
《計測自動制御学会論文集》 |2006年第11期|共8页
作者
飯間等; 黒江康明; Hitoshi IiMA; Yasuaki KUROE;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类自动化元件、部件;
关键词
reinforcement learning; swarm reinforcement learning; multi-agent; particle swarm optimization; information exchange;

机译：强化学习;群强化学习;多智能体;粒子群优化;信息交换;

相似文献

外文文献
中文文献
专利

1. エージェント間の情報交換に基づく群強化学習法 [J] . 飯間等, 黒江康明, Hitoshi IiMA, 計測自動制御学会論文集 . 2006,第11期

机译：基于主体间信息交流的群体强化学习方法
2. P2Pに基づく分散型電子マーケットE-GarageSaleにおけるエージェントの財の交換に基づく交渉手法 [J] . 服部宏充, 伊藤孝行, 新谷虎松, 人工知能学会論文誌 . 2003,第2期

机译：基于P2P的分散电子市场电子车库销售中基于代理商品交换的协商方法
3. P2Pに基づく分散型電子マーケットE-GarageSaleにおけるエージェントの財の交換に基づく交渉手法 [J] . 服部宏充, 伊藤孝行, 新谷虎松, 人工知能学会論文誌 . 2003,第2期

机译：基于P2P的分布式电子市场谈判方法，基于E-Garaganeale更换代理商的代理商
4. パレート報酬を考慮した政策群アーカイブに基づくマルチエージェント強化学習 [C] . 市川嘉裕, 高玉圭樹知能システムシンポジウム . 2014

机译：基于Parietic奖励的政策组归档的多功能钢筋学习
5. 建築物におけるコージェネレーションシステムの適用に関する研究－エネルギー有効利用に基づくシステム評価－ [D] . 湯淺和博. 1990

机译：热电联产系统在建筑物中的应用研究-基于有效能耗的系统评估-
6. 平成25年電気学会電子・情報・システム部門大会講演申込登録のご案内（第4報）／特集号の論文募集（「量子ビームによるナノバイオ物理応用技術」特集／「機械学習手法に基づく設備診断・監視技術」特集／「デペンダブルなサービスシステムに貢献する情報・システム技術」特集）／第17回アナログVLSIシンポジウム開催案内 [O] . 2013

机译：电子社会申请登记的信息电子社会电子和信息和系统司的消防社会（第4次报告）/特殊问题文件规范（“纳米梁物理应用技术按量子梁”/“设施诊断基于机器学习方法特殊功能/“特殊问题”“信息和系统技术导致可靠服务系统”）/第17个模拟VLSI研讨会举行指南

エージェント間の情報交換に基づく群強化学習法

摘要

著录项

相似文献

相关主题

期刊订阅