文摘
英文文摘
独创性声明及学位论文版权使用授权书
引言
第一章概率规划概述
1.1概率规划
1.1.1状态表示
1.1.2初始世界
1.1.3动作表示
1.1.4概率规划的定义
1.1.5概率规划的类型
1.2概率规划(Probabilistic planning)和不确定规划(planning under uncertainty)
1.3概率规划复杂度
1.3.1复杂类的介绍
1.3.2各类概率规划的复杂度
1.4概率规划语言
1.4.1概率化的PDDL(PPDDL)
1.4.2其它语言
1.5IPC-4中关于概率规划的一些问题
第二章马尔可夫决策过程(MDP)
2.1问题定义
2.2观察(observation)
2.3奖励和值
2.4界限和成功标准
2.5概率规划和马尔可夫决策问题
第三章DPG算法
3.1算法背景
3.2定义与表示
3.2.1命题、状态和目标集
3.2.2动作和动作序列
3.3算法描述
3.3.1规划图的扩张
3.3.2规划解的生成
3.3.3效用值的计算
3.4算法复杂度
3.5例子和实验结果
3.5.1概率积木世界
3.5.2护城河和城堡问题
3.5.3实验结果总结
第四章总结及后续工作
附录A 第一届规划调度系统比赛
附录B 第二届规划调度系统比赛
附录C 第三届规划调度系统比赛
附录D 主要概率规划器一览表
参考文献
致谢