Multiagent Reactive Plan Application Learning in Dynamic Environments

机译：动态环境中的多主体反应式计划应用学习

获取原文

获取原文并翻译 | 示例

页面导航

摘要
著录项
相似文献
相关主题

摘要

In addition to bottom-up learning approaches, which facilitate emergent policy learning, it also is desirable to have top-down control over learning so that a team of agents can also learn to apply general policies to diverse dynamic situations. We present a. multiagent case-based learning methodology to achieve this top-down control. In this methodology, high-level symbolic plans describe policies a team of agents needs to learn to apply to different situations. For each plan whose preconditions match their current team state, agents learn to operationalize that plan. In each training scenario, each agent learns a sequence of actions that implements each step in the given plan such that the entire plan is opera-tionalized under current external conditions. This application knowledge is acquired via searching through a small set of available high-level actions and testing the success of each sequence of actions in the situated environment. Similarity between a new situation and existing cases is measured by considering only the state internal to the team, and an agent stores the successful sequence of actions in the current plan step indexed under the current external state. By repeating this process for each plan step using many diverse training scenarios, a team of agents learns how to operationalize an entire plan in a wide variety of external situations, hence achieving generality. We demonstrate our approach using the RoboCup soccer simulator.

机译：除了自底向上的学习方法（它有助于紧急策略学习）之外，还希望对学习进行自上而下的控制，以便代理团队也可以学习将通用策略应用于各种动态情况。我们提出一个。基于案例的多主体学习方法可实现这种自上而下的控制。在这种方法中，高级符号计划描述了座席团队需要学习以应用于不同情况的策略。对于每个前提条件与其当前团队状态相匹配的计划，座席将学习如何实施该计划。在每种培训方案中，每个代理都学习一系列操作，这些操作将执行给定计划中的每个步骤，从而使整个计划在当前外部条件下可操作。通过搜索一小组可用的高级操作并在所处环境中测试每个操作序列的成功性来获取此应用程序知识。通过仅考虑团队内部的状态来度量新情况与现有案例之间的相似性，并且代理将成功的操作顺序存储在当前外部状态下编制索引的当前计划步骤中。通过使用多种多样的培训方案在每个计划步骤中重复此过程，特工团队将学习如何在各种外部情况下实施整个计划，从而实现通用性。我们使用RoboCup足球模拟器演示了我们的方法。

著录项

来源
《First International Joint Conference on Autonomous Agents and Multiagent Systems Pt.2, Jul 15-19, 2002, Bologna, Italy》|2002年|p.839-840|共2页
会议地点 Bologna(IT);Bologna(IT);Bologna(IT);Bologna(IT);Bologna(IT);Bologna(IT);Bologna(IT);Bologna(IT)
作者
Hueseyin Sevay; Costas Tsatsoulis;
展开▼
作者单位

Department of Electrical Engineering and Computer Science Information Telecommunication Technology Center 2335 Irving Hill Road University of Kansas Lawrence, KS 66045-7612, USA;

展开▼
会议组织
原文格式 PDF
正文语种 eng
中图分类自动化技术、计算机技术;
关键词
theory; algorithms;

机译：理论;算法;

相似文献

外文文献
中文文献
专利

1. Dynamically analyzing cell interactions in biological environments using multiagent social learning framework [J] . Chengwei Zhang, Xiaohong Li, Shuxin Li, Journal of Biomedical Semantics . 2017,第1期

机译：使用多主体社会学习框架动态分析生物环境中的细胞相互作用
2. Task allocation learning in a multiagent environment: Application to the RoboCupRescue simulation [J] . Sebastien Paquet, Brahim Chaib-draa, Patrick Dallaire, Multiagent and grid systems . 2010,第4期

机译：多代理环境中的任务分配学习：在RoboCupRescue仿真中的应用
3. Continual planning and acting in dynamic multiagent environments [J] . Michael Brenner, Bernhard Nebel Autonomous agents and multi-agent systems . 2009,第3期

机译：在动态多代理环境中进行持续规划并采取行动
4. Multiagent Reactive Plan Application Learning in Dynamic Environments [C] . Hiiseyin Sevay, Costas Tsatsoulis Recent advances in manufacturing engineering . 2011

机译：动态环境中的多主体反应式计划应用学习
5. Multiagent reactive plan application learning in dynamic environments. [D] . Sevay, Huseyin. 2004

机译：动态环境中的Multiagent反应计划应用程序学习。
6. Dynamically analyzing cell interactions in biological environments using multiagent social learning framework [O] . Chengwei Zhang, Xiaohong Li, Shuxin Li, 2017

机译：使用多主体社会学习框架动态分析生物环境中的细胞相互作用
7. Multiagent Reactive Plan Application Learning in Dynamic Environments By [O] . Hüseyin Sevay, Prof Susan Gauch, Prof Douglas Niehaus, 2009

机译：动态环境中的多主体反应计划应用学习
8. Assessing Learning Outcomes in a Broadcast Learning Environment: Application of the Dynamics Concepts Inventory [R] . Shelley, J. 2009

机译：评估广播学习环境中的学习成果：动态概念库存的应用

Multiagent Reactive Plan Application Learning in Dynamic Environments

摘要

著录项

相似文献

相关主题

期刊订阅