首页> 外文会议>Machine Learning and Cybernetics >Policy gradient fuzzy reinforcement learning
【24h】

Policy gradient fuzzy reinforcement learning

机译:政策梯度模糊钢筋学习

获取原文
获取外文期刊封面目录资料

摘要

This work presents a new approach for tuning conclusions of fuzzy rules based on reinforcement learning. Unlike the most of existing fuzzy reinforcement learning algorithms, which are based on value function, while our approach called policy gradient fuzzy reinforcement learning (PGFRL) bases on gradient estimate. In PGFRL, the algorithm GPOMDP is employed to estimate the performance gradient with respect to the parameters of fuzzy rules. In our work we prove the convergence of fuzzy rules' parameters to a local optimum given necessary conditions. The experiment results show the effectiveness of PGFRL.
机译:这项工作提出了一种新方法,可根据加固学习进行模糊规则的结论。与基于价值函数的最大现有的模糊增强学习算法不同,而我们的方法称为政策梯度模糊增强学习(PGFRL)基于梯度估计。在PGFR1中,使用算法GPOMDP来估计关于模糊规则参数的性能梯度。在我们的工作中,我们将模糊规则的参数的融合证明了对当地最佳的必要条件。实验结果表明了PGFRL的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号