文摘
英文文摘
第一章 绪论
1.1 引言
1.2 研究目标与意义
1.3 国内外研究现状
1.4 研究内容
1.5 论文组织结构
第二章 相关理论与技术
2.1 Agent理论与技术
2.1.1 Agent定义
2.1.2 Agent特性
2.1.3 BDI模型简介
2.2 强化学习基本概念
2.2.1 强化学习原理
2.2.2 强化学习的特点
2.2.3 马尔科夫决策过程
2.3 强化学习相关算法
2.3.1 TD算法
2.3.2 Q学习算法
2.3.3 Sarsa算法
第三章 基于Agent的决策仿真系统框架
3.1 分层学习及决策过程
3.1.1 自底向上的学习过程
3.1.2 自顶向下的决策过程
3.2 多任务分解学习的智能化框架
3.3 模型中各模块功能设计
第四章 决策仿真系统中Agent的认知模型
4.1 Agent认知模型
4.1.1 形式化定义
4.1.2 认知结构模型
4.2 Agent模型内部结构设计
4.2.1 各模块交互过程设计
4.2.2 各模块功能设计
4.3 Agent的决策与学习行为设计
4.3.1 Agent的决策与学习过程
4.3.2 Agent的运行流程
4.3.3 Agent的状态转换
第五章 强化学习方法在决策仿真系统中的应用
5.1 单Agent Q学习算法研究
5.1.1 Q学习算法分析
5.1.2 改进Q学习模型描述
5.1.3 改进Q学习算法描述
5.2 多Agent联合强化学习
5.2.1 多Agent强化学习信度分配问题
5.2.2 多Agent联合Q学习算法
第六章 实验研究
6.1 实验目的
6.2 实验环境
6.3 实验过程及结果分析
6.3.1 Agent认知模型的有效性验证
6.3.2 单Agent强化学习算法效率验证
6.3.3 多Agent联合强化学习算法效率验证
结束语
致谢
参考文献
在研期间研究成果