面向决策仿真的Agent模型中强化学习方法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

强化学习是一种无监督的机器学习技术，通过试错法即能找到最优解或者接近最优解，并能实现动态环境下的在线学习，因此强化学习被公认为是构成智能Agent的理想技术之一。决策仿真系统具有环境复杂、状态不确定等特点，如何将强化学习应用到决策仿真领域，是当前研究的热点与难点。
　　本文主要研究强化学习方法并应用到多Agent决策仿真系统中。首先根据分层学习和决策的思想，给出了基于Agent的决策仿真系统框架。接着本文提出了一种基于强化学习的Agent认知模型，将环境变化预测引入Agent模型，使Agent对环境在一定程度上具有前瞻性的预测能力。在对已有强化学习算法分析的基础上，提出了改进的单Agent Q学习算法，使系统中每个Agent都能根据需要自主学习。随后，本文分析了多Agent强化学习中的信度分配问题，并提出了多Agent联合Q学习算法，以提高整个多Agent系统的学习效率。
　　最后，本文通过对某决策仿真系统的实验，对本文提出的Agent认知模型和强化学习算法进行验证。实验表明，本文提出的Agent认知模型能够有效的应用于决策仿真系统，且强化学习算法提高了Agent的学习效率。

著录项

作者
段庆领;
展开▼
作者单位

西安电子科技大学;

展开▼
授予单位西安电子科技大学;
学科计算机软件与理论
授予学位硕士
导师姓名李青山;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算机仿真;自动推理、机器学习;
关键词
强化学习; Agent模型; 决策仿真; 系统框架; 认知模型; 自主学习;

相似文献

中文文献
外文文献
专利

1. 基于元深度强化学习方法的智能博弈决策模型研究 [J] . 徐志雄 ,曹雷 ,陈希亮 . 军事运筹与系统工程 . 2021,第003期
2. 遗传算法在面向敏捷制造ERP决策优化中的模型仿真应用 [J] . 周昕 ,纪颖 . 自动化技术与应用 . 2010,第006期
3. 面向并行Agent仿真的合成基准测试模型 [J] . 余文广 ,王维平 ,侯洪涛 . 系统工程与电子技术 . 2012,第004期
4. 面向Agent的导弹作战仿真概念模型设计 [J] . 李瑛 ,毕义明 . 系统工程与电子技术 . 2010,第001期
5. 几种agent强化学习方法的比较研究 [J] . 吴元斌 . 电脑知识与技术 . 2008,第013期
6. 面向系统和控制的导弹中制导段Agent模型建立与仿真 [C] . 胡云安 ,李静 ,邱荣剑 . 2007年中国智能自动化会议 . 2007
7. 面向软件自适应演化中的强化学习方法的研究 [A] . 张建国 . 2014

面向决策仿真的Agent模型中强化学习方法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅