基于加强学习的BDI Agent动作规划机制

陈梅; 胡晓辉

首页> 中文期刊> 《计算机工程与设计》 >基于加强学习的BDI Agent动作规划机制

基于加强学习的BDI Agent动作规划机制

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

To enable BDI agents making rational decisions about an appreciate course of action to pursue goals in dynamic and complex environments, the intention decision structure is described with the and/or graph which integrates goals with their opposite plans. Then,three different types of action planning decision strategies are developed based on the reinforcement learning according to the intention decision structure, respectively, single-step planning of the short-sighted BDI agents, multi-steps planning of the far-sighted BDl agents and the optimal-planning of the ideal BDI agents. Compared with traditional BDI agents systems, this new intention decision scheme overcomes the limitation of abstract high-level plans and easily to be implemented.%为了确保BDI Agent在动态,复杂的环境中实现基于某目标的动作序列决策任务,使用与/或图描述了意图决策结构,此结构将目标与实现这些目标的计划联系起来.根据意图决策结构,提出了3种不同的基于加强学习的动作规划策略,分别是短视性BDI Agent的单步规划、具有远见的BDI Agent的多步规划和追求完美的BDI Agent的最优规划.与传统的BDI Agent系统相比,这种新的意图决策模式克服了计划抽象的不足,并且易于编程实现.

著录项

来源
《计算机工程与设计》 |2011年第3期|1043-1046|共4页
作者
陈梅; 胡晓辉;
展开▼
作者单位

兰州交通大学;

电信学院;

甘肃;

兰州;

730070;

兰州交通大学;

电信学院;

甘肃;

兰州;

730070;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
BDI Agent; 加强学习; 意图决策; 动作规划; 目标;

相似文献

中文文献
外文文献
专利

1. 基于Q-learning的不确定环境BDI Agent最优策略规划研究 [J] . WAN Qian ,LIU Wei ,XU Long-long . 计算机工程与科学 . 2019,第001期
2. ABDIDSS环境下基于多Agents协作的任务求解 [J] . 杨善林 ,胡小建 ,余本功 . 合肥工业大学学报（自然科学版） . 2005,第009期
3. BDI agent导引修改机制用于Peer to Peer系统文件操作 [J] . 茅洪波 ,于万波 ,魏小鹏 . 大连理工大学学报 . 2003,第0z1期
4. 基于效用的Agent多动作选择承诺机制 [J] . 莫思敏 ,谭瑛 ,曾建潮 . 计算机工程与应用 . 2005,第024期
5. 基于BDI Agent模型的对中小企业创新系统诊断框架及对策 [J] . 张橙 ,朱良天 . 经济研究导刊 . 2019,第002期
6. 基于Q-learning的不确定环境BDI Agent最优策略规划研究 [C] . WanQian ,万谦 ,LiuWei . 2018年全国理论计算机科学学术年会 . -1
7. ABDIDSS环境下多Agents之间协作与近似推理机制研究 [A] . 胡小建 . 2004

基于加强学习的BDI Agent动作规划机制

摘要

著录项

相似文献

相关主题

期刊订阅