逻辑半马尔可夫决策过程及Q学习

王蓁蓁; 王智钢

首页> 中文期刊> 《金陵科技学院学报》 >逻辑半马尔可夫决策过程及Q学习

逻辑半马尔可夫决策过程及Q学习

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

增强学习已经开始向关系增强学习发展,并且产生了许多新的算法.这些方法是将命题表达提升为关系或计算逻辑的表达.提出了一种新的表达形式,称为逻辑半马尔可夫决策过程.它是将逻辑程序与半马尔可夫过程相结合.在此框架中,抽象(状态或行动)是至关重要的,并且提出了对于逻辑半马尔可夫决策过程的Q-学习算法,给出其收敛证明.这种框架对在关系增强学习发展中处理时间连续方面提供了一个合理的基础.

著录项

来源
《金陵科技学院学报》 |2013年第2期|13-19|共7页
作者
王蓁蓁; 王智钢;
展开▼
作者单位

金陵科技学院信息技术学院,江苏南京211169;

江苏省信息分析工程实验室,江苏南京211169;

金陵科技学院信息技术学院,江苏南京211169;

江苏省信息分析工程实验室,江苏南京211169;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工智能理论;
关键词
关系增强学习; 半马尔可夫; 逻辑半马尔可夫; 决策过程;

相似文献

中文文献
外文文献
专利

1. 基于半马尔可夫决策过程的风机变速箱最优维修策略研究 [J] . 方冰 . 化工自动化及仪表 . 2014,第006期
2. 基于连续时间半马尔可夫决策过程的Option算法 [J] . 唐昊 ,张晓艳 ,韩江洪 . 计算机学报 . 2014,第9期
3. 逻辑马尔可夫决策过程的正则条件概率理论 [J] . 王蓁蓁 ,邢汉承 . 南京大学学报：自然科学版 . 2013,第4期
4. 结合Q学习和模糊逻辑的单路口交通信号自学习控制方法 [J] . 何兆成 ,佘锡伟 ,杨文臣 . 计算机应用研究 . 2011,第001期
5. 认知无线网络中基于模糊逻辑和Q学习的集中式动态频谱分配(英文) [J] . 张文柱 ,刘栩辰 . 中国通信 . 2011,第007期
6. 半逻辑半定值自适应方法在变电培训继电保护仿真中的应用 [C] . 杨博涛 ,艾欣 ,徐正清 . 中国高等学校电力系统及其自动化专业第二十四届学术年会 . 2008
7. 基于逻辑马尔可夫决策过程的关系强化学习研究 [A] . 宋志伟 . 2006

逻辑半马尔可夫决策过程及Q学习

摘要

著录项

相似文献

相关主题

期刊订阅