径向基函数网络和实例学习在强化学习中的应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近些年来对于强化学习的研究工作越来越多,强化学习被认为是设计智能主体核心技术之一.研究者青睐强化学习主要是它的一般性,仅仅只需要给定目标,智能主体会通过与环境的不断交互来达到.传统的强化学习算法仅限于离散有限的输入空间,运用查表法来存储值函数,然而实际系统的状态或决策空间大多数是连续的,因此不可能用查表法来表示值函数.一个比较好的方法是利用近似器逼近值函数,但是由于可能发散逼近并不是简单地用近似器替换表结构.很多的研究显示,利用局部逼近的技术能够比较好的逼近值函数,本文主要利用局部逼近来表示值函数,主要工作有:(1)利用径向基函数网络来拟合值函数,解决了连续状态空间的泛化表示.(2)利用实例学习表示值函数,提高了系统性能.(3)对上述两种方法进行了实验,显示出较好的结果.

著录项

作者
林联明;
展开▼
作者单位

合肥工业大学;

展开▼
授予单位合肥工业大学;
学科计算机软件与理论
授予学位硕士
导师姓名王浩;
年度 2005
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
强化学习; 马尔可夫决策过程; 径向基函数网络; 人工智能; 机器学习;
入库时间 2022-08-17 10:17:58

相似文献

中文文献
外文文献
专利

1. 基于径向基函数网络的强化学习在机器人足球中的研究(英文) [J] . 罗青 ,李智军 ,Iqbal Nadeem . 系统仿真学报 . 2002,第8期
2. 基于免疫原理的径向基函数网络在线学习算法及其在热工过程大范围工况建模中的应用 [J] . 林金星 ,沈炯 ,李益国 . 中国电机工程学报 . 2006,第9期
3. 一种可在线学习的变结构径向基函数网络及其在被动声纳目标识别中的应用 [J] . 宋爱国 . 电子学报 . 1999,第10期
4. 强合作,强化学习——浅谈合作学习在初中美术教学中的应用 [J] . 乔宁 . 文理导航 . 2021,第031期
5. 基于矢量量化的强化学习及其在机器人行为学习中的应用 [J] . 段勇 ,伊婧 ,张永赫 . 高技术通讯 . 2011,第002期
6. 一种强化学习算法应用于多移动机器人的觅食实例研究 [C] . 任燚 ,陈宗海 . 中国自动化学会系统仿真专业委员会中国系统仿真学会仿真计算机与软件专业委员会2004学术年会 . 2004
7. 深度学习在强化学习中的应用研究 [A] . 詹亮 . 2020

径向基函数网络和实例学习在强化学习中的应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅