一种基于启发式轮廓表的逻辑强化学习方法

刘全; 高阳; 陈道蓄; 孙吉贵; 姚望舒

首页> 中文期刊>计算机研究与发展 >一种基于启发式轮廓表的逻辑强化学习方法

一种基于启发式轮廓表的逻辑强化学习方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支.针对强化学习一直被"维数灾"问题所困扰的问题,提出在关系强化学习的基础上,引入启发式轮廓表的方法,采用含轮廓表的一阶谓词表示状态、活动和Q-函数,充分发挥Prolog表的优势,将逻辑谓词规则与强化学习相结合,形成一种新的逻辑强化学习方法--CCLORRL,并对其收敛性进行了证明.该方法使用轮廓形状谓词产生形状状态表,大幅度地减少状态空间;利用启发式规则指导动作的选择,减少了样本中不存在状态选择的盲目性.CCLORRL算法应用于俄罗斯方块中,实验表明,该方法是比较高效的.

著录项

来源
《计算机研究与发展》|2008年第11期|1824-1830|共7页
作者
刘全; 高阳; 陈道蓄; 孙吉贵; 姚望舒;
展开▼
作者单位

苏州大学计算机科学与技术学院,江苏,苏州,215006;

苏州大学计算机科学与技术学院,江苏,苏州,215006;

苏州大学计算机科学与技术学院,江苏,苏州,215006;

吉林大学符号计算与知识工程教育部重点实验室,长春,130012;

苏州大学计算机科学与技术学院,江苏,苏州,215006;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工智能理论;
关键词
维数灾; 启发式轮廓表; 谓词; 逻辑强化学习; CCLORRL算法;
入库时间 2022-08-18 04:53:42

相似文献

中文文献
外文文献
专利

1. 一种基于启发式奖赏函数的分层强化学习方法 [J] . 刘全 ,闫其粹 ,伏玉琛 . 计算机研究与发展 . 2011,第012期
2. 基于BP神经网络的双层启发式强化学习方法 [J] . 刘智斌 ,曾晓勤 ,刘惠义 . 计算机研究与发展 . 2015,第003期
3. 一种基于流量预测的启发式路由表更新算法 [J] . 时鸿涛 ,郭忠文 . 科学技术与工程 . 2013,第024期
4. 一种基于智能调度的可扩展并行强化学习方法 [J] . 刘全 ,傅启明 ,杨旭东 . 计算机研究与发展 . 2013,第004期
5. 一种基于扩展查询表的可编程逻辑单元 [J] . 郭斌林 ,童家榕 . 计算机学报 . 2003,第010期
6. 一种基于Rough集和启发式知识约简的分类学习方法 [C] . 邬敏华 ,王小平 ,曹立明 . 第三届中国Rough集与软计算机学术研讨会 . 2003
7. Cas-GAN：一种基于GAN和强化学习的对话管理策略学习方法 [A] . Nabeel Muhammad . 2019

一种基于启发式轮廓表的逻辑强化学习方法

摘要

著录项

相似文献

相关主题

期刊订阅