神经网络增强学习的梯度算法研究

徐昕; 贺汉根

首页> 中文期刊> 《计算机学报》 >神经网络增强学习的梯度算法研究

神经网络增强学习的梯度算法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对具有连续状态和离散行为空间的Markov决策问题，提出了一种新的采用多层前馈神经网络进行值函数逼近的梯度下降增强学习算法.该算法采用了近似贪心且连续可微的Boltzmann分布行为选择策略，通过极小化具有非平稳行为策略的Bellman残差平方和性能指标，以实现对Markov决策过程最优值函数的逼近.对算法的收敛性和近似最优策略的性能进行了理论分析.通过Mountain-Car学习控制问题的仿真研究进一步验证了算法的学习效率和泛化性能.

著录项

来源
《计算机学报》 |2003年第2期|227-233|共7页
作者
徐昕; 贺汉根;
展开▼
作者单位

国防科学技术大学自动化研究所长沙10073;

国防科学技术大学自动化研究所长沙10073;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工智能理论;
关键词
增强学习; 神经网络; arkov决策过程; 值函数逼近; 梯度下降;

相似文献

中文文献
外文文献
专利

1. 带正则项Pi-sigma神经网络梯度学习算法研究 [J] . 张岩庆 ,范钦伟 ,贺兴时 . 信息与电脑 . 2020,第001期
2. 基于改进共轭梯度理论神经网络优化算法研究 [J] . 邢晓敏 ,商国敬 . 电测与仪表 . 2014,第019期
3. 基于人工神经网络的改进共轭梯度算法研究 [J] . 刘舒 . 信息技术 . 2004,第001期
4. 基于正交校正共轭梯度法的快速神经网络学习算法研究 [J] . 郑建国 ,刘芳 ,焦李成 . 电子与信息学报 . 2002,第005期
5. 基于深度增强学习的网络数据包分类算法研究 [J] . 郭鹏 . 佳木斯大学学报（自然科学版） . 2020,第002期
6. 基于改进共轭梯度理论的神经网络优化算法研究 [C] . 张海夺 ,李海涛 ,刘洋 . 吉林省第九届科学技术学术年会 . 2016
7. 基于卷积神经网络的随机梯度下降优化算法研究 [A] . 谭涛 . 2020

1. 基于用于深度神经网络的增强学习的张量分解中的排序选择 [P] . 中国专利： CN113179660A . 2021-07-27

2. 基于梯度残差U型卷积神经网络的图像篡改检测技术 [P] . 中国专利： CN113920094A . 2022-01-11

3. A Method and Apparatus for Distributed Congestion Control of VANET using Reinforcement Learning Based on Neural Network Model [P] . 外国专利： KR102257536B1 . 2021-05-31

机译：基于神经网络模型的增强学习的叶片分布式拥塞控制方法和装置

4. TRAINING SERVER AND METHOD FOR GENERATING A PREDICTIVE MODEL OF A NEURAL NETWORK THROUGH DISTRIBUTED REINFORCEMENT LEARNING [P] . 外国专利： US2021064968A1 . 2021-03-04

机译：通过分布式增强学习，培训服务器和用于生成神经网络预测模型的方法

5. TRAINING SERVER AND METHOD FOR GENERATING A PREDICTIVE MODEL OF A NEURAL NETWORK THROUGH DISTRIBUTED REINFORCEMENT LEARNING [P] . 外国专利： EP3805996A1 . 2021-04-14

机译：通过分布式增强学习，培训服务器和用于生成神经网络预测模型的方法

相关主题

神经网络增强学习的梯度算法研究

摘要

著录项

相似文献

相关主题

期刊订阅