首页> 中文学位 >离散时间马尔可夫决策过程最优平稳策略的灵敏度分析及其应用
【6h】

离散时间马尔可夫决策过程最优平稳策略的灵敏度分析及其应用

代理获取

目录

文摘

英文文摘

声明

第1章前言

1.1研究工作现状综述

1.2本文的目的及主要内容

第2章离散时间马尔可夫决策过程模型

2.1模型的数学模型

2.2策略

2.3最优性准则

第3章线性规划及其灵敏度分析

3.1线性规划及其对偶理论

3.2线性规划中的灵敏度分析

第4章折扣准则下DTMDP最优平稳策略寻优及其灵敏度分析

4.1 DTMDP折扣模型的线性规划问题

4.2 DTMDP折扣最优平稳策略与对偶规划最优解的关系

4.3 DTMDP折扣最优平稳策略灵敏度分析实例

第5章平均准则下DTMDP最优平稳策略寻优及其灵敏度分析

5.1单链DTMDP平均模型的线性规划问题

5.2单链DTMDP平均最优平稳策略与对偶规划最优解的关系

5.3单链DTMDP平均最优平稳策略灵敏度分析实例

5.4多链DTMDP平均模型的线性规划问题

5.5多链DTMDP平均最优平稳策略与对偶规划最优解的关系

5.6多链DTMDP平均最优平稳策略灵敏度分析实例

第6章总结和展望

参考文献

附录

致谢

展开▼

摘要

本文主要是研究离散时间马尔可夫决策过程最优平稳策略的灵敏度分析及其应用。 全文主要内容由理论基础和实例应用两部分组成。 本文介绍了离散时间的马尔可夫决策过程(DTMDP)的数学描述和决策规则,回顾了线性规划与灵敏度分析的知识,借助定义最优性方程,分别给出了DTMDP折扣模型与DTMDP平均模型这两种常见的DTMDP模型用线性规划问题的描述和用线性规划寻优的算法,也分别论证了这两种DTMDP模型中最优平稳策略与对偶规划最优解的关系,进而以运筹学中的灵敏度分析理论为基础,分别研究了这两种DTMDP模型最优平稳策略的灵敏度分析,其中对DTMDP平均模型还分遍历链、单链、多链三种情况来讨论,并分别通过实例来说明这种灵敏度分析方法的可行性应用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号