A Study on State Grouping and Opportunity Evaluation for Reinforcement Learning Methods

Wenwei Yu; Hiroshi Yokoi; Yukinori Kakazu

首页> 外文期刊>電気学会論文誌. C >A Study on State Grouping and Opportunity Evaluation for Reinforcement Learning Methods

【24h】

A Study on State Grouping and Opportunity Evaluation for Reinforcement Learning Methods

机译：强化学习方法的状态分组与机会评估研究

获取原文

获取原文并翻译 | 示例

获取外文期刊封面封底 >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

In this paper, we propose the State Grouping scheme for coping with the problem of scaling up the Reinforcement Learning Algorithm to real, large size application. The grouping scheme is based on Geographical and trial-error information, and is made up with state generating, state combining, state Splitting, state forgetting procedures, with corresponding action selecting module and learning module.

机译：在本文中，我们提出了状态分组方案，以解决将强化学习算法扩展到实际的大型应用程序的问题。该分组方案基于地理和试错信息，由状态生成，状态合并，状态分解，状态遗忘过程，相应的动作选择模块和学习模块组成。

著录项

来源
《電気学会論文誌. C》 |1997年第9期|p.1300-1307|共8页
作者
Wenwei Yu; Hiroshi Yokoi; Yukinori Kakazu;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类通信;电工技术;
关键词

相似文献

外文文献
中文文献
专利

1. Empirical evaluation methods for multiobjective reinforcement learning algorithms [J] . Peter Vamplew, Richard Dazeley, Adam Berry, Machine Learning . 2011,第1a2期

机译：多目标强化学习算法的经验评估方法
2. Integrating Temporal Difference Methods and Self-Organizing Neural Networks for Reinforcement Learning With Delayed Evaluative Feedback [J] . Tan A.-H., Lu N., Xiao D. IEEE Transactions on Neural Networks . 2008,第2期

机译：整合时差方法和自组织神经网络用于延迟评估反馈的强化学习
3. Reinforcement Learning zur Planung von Arbeitsprozessen: Anwendung von Reinforcement Learning Methoden zur Planung von Arbeitsaufgaben im industriellen Bereich [J] . Helge Ulo Dinkelbach, Julia Schuster, Fred H. Hamker Industrie management . 2015,第1期

机译：用于计划工作流程的强化学习：将强化学习方法应用于工业部门的计划任务
4. A Study on State Grouping and Opportunity Evaluation for Reinforcement Learning Methods [C] . Wenwei Yu, Hiroshi Yokoi, Yukinori Kakazu Artifical Neural Networks in Engineering (ANNIE'96) Conference, held November 10-13, 1996, in St. Louis, Missouri, U.S.A. . 1996

机译：强化学习方法的状态分组与机会评估研究
5. Improved empirical methods in reinforcement-learning evaluation [D] . Marivate, Vukosi N. 2015

机译：强化学习评估中改进的经验方法
6. An Evaluation Methodology for Interactive Reinforcement Learning with Simulated Users [O] . Adam Bignold, Francisco Cruz, Richard Dazeley, 2021

机译：模拟用户的交互式加固学习评估方法
7. A Comparison Of Supervised And Reinforcement Learning Methods On A Reinforcement Learning Task [O] . Vijaykumar Gullapalli 1992

机译：强化学习任务中监督学习和强化学习方法的比较

A Study on State Grouping and Opportunity Evaluation for Reinforcement Learning Methods

摘要

著录项

相似文献

相关主题

期刊订阅