多目标约束连续时间马氏决策过程的折扣模型

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文研究的是具有可数状态空间、紧的行动空间、有界转移率函数及上半连续报酬率函数的多约束条件马尔可夫决策过程。目的是解决在其它的报酬率函数的折扣期望满足约束条件时，使目标报酬率函数的折扣期望最大的最优决策的存在性问题。我们将在文章中提出一些假设以保证约束最优策略的存在，也进一步证明存在平稳的约束最优策略，而且约束最优平稳策略可选择的行为的个数不会超过马氏平稳决策所采用的行为个数加上约束条件的个数。文章是通过模型转换，把连续时间模型转换成离散时间模型，再通过解决转换后的问题来解决原问题的。最后我们通过一个例子进一步说明本文所得的结果。

著录项

作者
刘冰冰;
展开▼
作者单位

中山大学;

展开▼
授予单位中山大学;
学科概率论与数理统计
授予学位硕士
导师姓名戴永隆,郭先平;
年度 2005
页码
总页数
原文格式 PDF
正文语种中文
中图分类判决函数（决策函数）;马尔可夫过程;
关键词
马尔可夫决策过程; 有界转移率函数; 折扣准则; M-随机平稳策略; 多约束条件;
入库时间 2022-08-17 10:26:56

相似文献

中文文献
外文文献
专利

1. 连续时间马氏决策过程——最优策略对折扣因子的灵敏度分析 [J] . 朱益民 . 浙江工业大学学报 . 1999,第2期
2. 可变折扣马氏决策过程首达模型列的收敛问题 [J] . 吴晓 ,郭圳滨 . 应用概率统计 . 2021,第006期
3. 离散时间折扣多目标马氏决策模型：加权与字典序准则 [J] . 贾让成 . 运筹与管理 . 1999,第001期
4. 字典序下的折扣多目标半马氏决策模型 [J] . 贾让成 . 西安电子科技大学学报 . 1989,第002期
5. 字典序下的折扣多目标半马氏决策模型 [J] . 贾让成 . 西安电子科技大学学报 . 1989,第0Z1期
6. 状态信息不完全的折扣多目标马氏决策模型 [C] . 贾让成 . 第三届中国青年运筹与管理学者大会 . 1999
7. 随机环境下连续时间马氏决策过程 [A] . 赵坤 . 2020

多目标约束连续时间马氏决策过程的折扣模型

目录

摘要

著录项

相似文献

相关主题

期刊订阅