基于策略迭代和遗传算法的SMDP鲁棒控制策略求解

程燕; 唐昊; 马学森

首页> 中文期刊> 《合肥工业大学学报：自然科学版》 >基于策略迭代和遗传算法的SMDP鲁棒控制策略求解

基于策略迭代和遗传算法的SMDP鲁棒控制策略求解

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

半马尔可夫决策过程(SMDP)描述的一类受控半Markov系统,其模型参数在实际中常常不确定或不可知,可能导致随机过程的性能函数和系统参数(即嵌入链转移概率和状态逗留时间分布)皆不确定。该文针对参数不相关的情况,给出求解鲁棒控制策略的迭代算法,并在迭代过程中引入遗传算法,以提高全局优化能力。数值例子表明,基于遗传算法的策略迭代应用于鲁棒决策问题中具有较好的优化效果。

著录项

来源
《合肥工业大学学报：自然科学版》 |2007年第11期|1404-1407|共4页
作者
程燕; 唐昊; 马学森;
展开▼
作者单位

合肥工业大学计算机与信息学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类设计、性能分析与综合;
关键词
半马尔可夫决策过程; 性能势; 鲁棒控制; 遗传算法;

相似文献

中文文献
外文文献
专利

1. 基于迭代动态规划的聚合物驱注入策略求解 [J] . 张玉斌 ,李树荣 ,张晓东 . 计算机仿真 . 2008,第005期
2. 基于SMDP的虚拟化无线传感网络资源分配策略 [J] . 王汝言 ,李宏娟 ,李红霞 . 太赫兹科学与电子信息学报 . 2020,第001期
3. 基于SMDP的虚拟化无线传感网络资源分配策略 [J] . 王汝言 ,李宏娟 ,李红霞 . 太赫兹科学与电子信息学报 . 2020,第001期
4. 基于SMDP的异构无线网络联合接纳控制策略研究 [J] . 张媛媛 ,肖创柏 ,王坚 . 北京工业大学学报 . 2015,第009期
5. 基于贪婪策略的遗传算法求解多星观测任务优化 [J] . 刘翔 ,雷明佳 ,陈韬亦 . 无线电工程 . 2019,第001期
6. 基于鲁棒控制的闭环供应链交互库存补货策略 [C] . ZHANG Shu-hong ,张曙红 . 第十七届中国管理科学学术年会 . 2015
7. 迭代学习控制系统的迭代域鲁棒控制策略研究 [A] . 杜鑫 . 2012

基于策略迭代和遗传算法的SMDP鲁棒控制策略求解

摘要

著录项

相似文献

相关主题

期刊订阅