声明
第一章 引言
1.1研究背景及意义
1.2研究现状
1.3研究内容
1.4论文组织结构
第二章 背景知识
2.1马尔科夫决策过程
2.2 POMDP模型
2.3信念状态
2.4值函数与最优策略的计算方法
2.5 POMDP的基本方法
2.6本章小结
第三章 面向连续空间POMDP问题的高效算法
3.1策略图
3.2面向连续空间POMDP问题的高效算法
3.3实验及结果分析
3.4本章小结
第四章 优化的连续状态蒙特卡罗值迭代算法
4.1蒙特卡罗值迭代算法
4.2连续状态POMDP问题的优化算法
4.3实验及结果分析
4.4本章小结
第五章 连续状态大规模观察空间的银杏叶搜索算法
5.1基于试验的异步值迭代算法
5.2连续状态大规模观察空间的银杏叶搜索算法
5.3实验及结果分析
5.4本章小结
第六章 总结与展望
6.1总结
6.2展望
参考文献
攻读硕士学位期间公开发表(录用)的论文及参与的项目
一、公开发表(录用)的学术论文
二、参加的科研项目
致谢