声明
摘要
第1章 绪论
1.1 研究背景与意义
1.2 国外研究现状
1.2.1 分布式智能模型
1.2.2 4D/RCS体系结构
1.3 国内研究现状
1.4 本文研究工作
1.5 内容安排
第2章 分布式体系结构
2.1 多智能体模型
2.1.1 多智能体布局
2.1.2 智能体分类
2.1.3 多智能体结构
2.2 多智能体消息流
2.2.1 消息传递支撑平台
2.2.2 智能体数据流
2.2.3 事件和状态
2.3 实验
2.3.1 消息传递平台测试
2.3.2 实际环境中的系统运行测试
2.4 本章小结
第3章 策略生成的学习架构
3.1 马尔可夫决策过程及相关模型
3.1.1 马尔可夫决策过程
3.1.2 基于马尔可夫决策过程的规划、行动和学习的集成
3.2 策略求解——增强学习
3.3 回报学习——逆增强学习
3.3.1 逆增强学习原理
3.3.2 逆增强学习算法
3.3.3 逆增强学习的进展
3.4 分布式架构下的逆增强学习
3.4.1 示教特征期望获取
3.4.2 回报估计
3.5 实验
3.6 本章小结
第4章 回报特征的自动选择
4.1 回报特征降维
4.1.1 原理
4.1.2 经典的降维方法
4.1.3 回报特征降维算法
4.2 实验
4.3 本章小节
第5章 总结与展望
5.1 总结
5.2 展望
参考文献
攻读硕士学位期间主要研究成果
致谢
浙江大学;