连续时间Markov决策过程的均值-方差优化问题

叶柳儿; 黄香香

首页> 中文期刊> 《中国科学》 >连续时间Markov决策过程的均值-方差优化问题

连续时间Markov决策过程的均值-方差优化问题

开具论文收录证明 >>

文献代查 >>

团队文献服务 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

本文考虑连续时间Markov决策过程折扣模型的均值-方差优化问题.假设状态空间和行动空间均为Polish空间,转移率和报酬率函数均无界.本文的优化目标是在折扣最优平稳策略类里,选取相应方差最小的策略.本文致力于寻找Polish空间下Markov决策过程均值-方差最优策略存在的条件.利用首次进入分解方法,本文证明均值-方差优化问题可以转化为＂等价＂的期望折扣优化问题,进而得到关于均值-方差优化问题的＂最优方程＂和均值-方差最优策略的存在性以及它相应的特征.最后,本文给出若干例子说明折扣最优策略的不唯一性和均值-方差最优策略的存在性.

著录项

来源
《中国科学》 |2014年第8期|P.883-898|共16页
作者
叶柳儿; 黄香香;
展开▼
作者单位

展开▼
原文格式 PDF
正文语种 CHI
中图分类最优化的数学理论;
关键词
连续时间Markov决策过程; 折扣最优化; 方差最小; 均值-方差最优策略;

相似文献

中文文献
外文文献
专利

1. 带转移机制且股票价格服从几何Levy过程的连续时间均值-方差投资组合选择 [J] . 伍慧玲 ,李仲飞 . 中山大学学报（自然科学版） . 2011,第001期
2. 基于参照因子的连续时间均值方差最优投资策略 [J] . 卫淑芝 ,叶中行 . 山西大学学报（自然科学版） . 2008,第003期
3. 随机线性二次最优控制(LQ)在连续时间均值--方差投资组合中的应用 [J] . 李宏杰 . 嘉兴学院学报 . 2003,第003期
4. 均值-半方差投资组合优化问题的HHO算法求解 [J] . 倪百秀 ,朱佩佩 ,王雪莹 . 皖西学院学报 . 2020,第004期
5. 连续时间Markov决策过程互模拟等价及逻辑保持 [J] . 黄镇谨 ,陆阳 ,杨娟 . 控制理论与应用 . 2016,第008期
6. 基于CVaR的均值—VaR前沿研究——兼与均值—方差前沿的比较 [C] . 朱波 ,房志东 . 第六届中国管理科学与工程论坛 . 2008
7. 均值-方差准则下连续时间证券投资选择研究 [A] . 张立东 . 2014

连续时间Markov决策过程的均值-方差优化问题

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅