首页> 中文期刊> 《湖南大学学报：自然科学版》 >观察过程状态数为可数的POMDP的算法

观察过程状态数为可数的POMDP的算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

给出了观察过程状态数为可数时，部分可观的马尔可夫决策规划（ＰＯＭＤＰ）折扣模型的逼近法和算法．算法保证了能求到ε－最优的平稳策略和ε－最优的期望费用函数．

著录项

来源
《湖南大学学报：自然科学版》 |1996年第1期|25-32|共8页
作者
许青松;
展开▼
作者单位

湖南大学应用数学系;

展开▼
原文格式 PDF
正文语种 chi
中图分类对策论（博弈论）;
关键词
ε-最优策略; 马氏决策规划; 折扣模型; 算法;

相似文献

中文文献
外文文献
专利

1. 基于部分可观察马尔科夫决策过程(POMDP)的贪婪算法次优频谱接入 [J] . 张娟 . 科学技术与工程 . 2014,第015期
2. 基于环境状态分布优化的POMDP值迭代求解算法 [J] . 朱荣鑫 ,王譞 ,刘峰 . 计算机应用研究 . 2022,第2期
3. 一种基于信念状态压缩的实时POMDP算法 [J] . 仵博 ,吴敏 . 控制与决策 . 2007,第12期
4. 可数状态空间的平均成本马氏决策过程 [J] . 张俊玉 ,吴怡婷 ,夏俐 . 控制理论与应用 . 2021,第011期
5. 波动率服从可数状态的马氏过程的期权定价 [J] . 王跃恒 ,包汉俞 ,李应求 . 数学理论与应用 . 2012,第001期
6. POMDP中基于内部状态的多agent强化学习 [C] . 方长胜 ,王浩 ,王池社 . 中国仪器仪表学会第九届青年学术会议 . 2007
7. 可数背景状态下QBD过程的几何衰变及应用 [A] . 杨阳 . 2005

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号