第一个书签之前
摘 要
ABSTRACT
绪论
问题提出
研究背景
理论背景
研究目标
国内外研究现状
无人机任务描述与决策方法
MDP参数不确定性的研究
不确定决策和优化求解方法
模型检验
论文研究内容及创新点
研究内容
创新点
论文组织结构
基于概率模型检验的不确定决策模型
序言
任务描述语言
线性时序逻辑
Büchi自动机
确定性Rabin自动机
不确定马尔科夫决策过程
马尔科夫决策过程的基本描述
MDP的不确定模型
MDP参数的不确定性分级
不确定条件下的概率模型检验
确定条件下的模型检验
MDP相关的模型检验的基本概念和定义
MDP与LTL相结合的概率模型检验框架
本章小结
基于信息差决策理论的无人机鲁棒满意决策方法
序言
基于信息差的不确定MDP模型
系统模型
信息差决策理论
基于信息差的鲁棒满意决策问题
基于信息差的MDP模型
问题建模
鲁棒满意决策框架
鲁棒满意策略求解方法
单调性定理
鲁棒满意最优性
最高最坏情况LSP的计算
鲁棒满意策略生成算法
鲁棒性评价算法
实验结果与分析
实验构建
实验结果与分析
本章小结
基于PAC增强学习的无人机多目标任务决策方法
序言
基于PAC增强学习的近似最优决策
问题描述
安全的探索机制
基于PAC增强学习算法的近似最优决策
算法性能分析
实验设计与算法实现
面向多目标决策问题的学习方法
问题描述
分阶段决策方法
基于Q学习的最优策略生成
实验设计与算法实现
本章小结
基于双有限时域的多无人机协同任务决策方法
序言
双有限时域协同序贯决策框架
有限时域序贯运动策略合成
划分相关任务集合
构造有限时域相交自动机
构造有限时域乘积系统
求解协同序贯行为策略
滚动时域协同策略执行
有限时域协同策略投影
有限时域协同策略执行
仿真实验与分析
仿真想定描述
实验过程与结果分析
本章小结
总结与展望
论文工作总结
研究展望
致谢
参考文献
作者在学期间取得的学术成果
鲁棒决策方法
LDC标准
WRF标准