首页> 中文期刊>湖南师范大学自然科学学报 >Q（f）—过程非唯一时连续时间折扣目标MDP

Q（f）—过程非唯一时连续时间折扣目标MDP

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

考虑的是可数状态空间连续时间ＭＤＰ的折扣模型，与以往不同的是，我们放弃了由策略ｆ所确定的Ｑ（ｆ）－过程唯一的传统假设。而首次考虑Ｑ（ｆ）－过程非唯一的情形，借助于Ｑ－过程的构造理论，用拓扑分析的方法，证明了最优策略的存在性。

著录项

来源
《湖南师范大学自然科学学报》|1996年第3期|7-12|共6页
作者
郭先平;
展开▼
作者单位

湖南师范大学数学系;

展开▼
原文格式 PDF
正文语种 CHI
中图分类随机过程;
关键词
连续时间; 折扣目标; Q过程; 马氏决策规划;
入库时间 2023-07-25 21:00:02

相似文献

中文文献
外文文献
专利

1. 非时齐MDP向时齐MDP的转化 [J] . 秦叔明 . 云南工业大学学报 . 1996,第002期
2. 折扣与无折扣MDPs:一个基于SARSA(λ)算法的实例分析 [J] . 陈焕文 ,谢丽娟 . 计算机工程与应用 . 2002,第009期
3. 连续时间非时齐马氏过程的广义Dobrushin系数的估计 [J] . 宋娟 ,张铭 . 数学杂志 . 2016,第005期
4. 多目标准则下的折扣非时齐马氏决策规划：分层序列法 [J] . 贾让成 . 西北师范大学学报：自然科学版 . 1996,第002期
5. 折扣MDP非ε-最优策略的检验准则 [J] . 李成福 . 数学理论与应用 . 1999,第004期
6. 折扣－平均混合准则下的向量值ＭＤＰ [C] . 贾让成 . 1993年中国控制与决策学术年会 . 1993
7. 连续时间MDP折扣模型的单调最优策略 [A] . 廖恭图 . 2010

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号