首页> 外文期刊>计测と制御 >リレー解説に寄せて:強化学習研究の歩み
【24h】

リレー解説に寄せて:強化学習研究の歩み

机译:提交中继注释:加强学习研究历史

获取原文
获取原文并翻译 | 示例
           

摘要

強化学習とは,ゴール指向型の学習と意思決定を理解し実現するための計算論的な接近法であり,試行錯誤による環境との相互作用を通じて学習していくという点において,教師による教示や環境の完全なモデルに依存する他の学習とは区別される.この強化学習(reinforcement learning)の研究には,大きく3つの流れが存在したと考えられる.第一の流れとして分類子システム第二はニューラルネットワーク関連の研究における試行錯誤学習,第三にマルコフ決定過程の最適制御問題とダイナミックプログラミングが挙げられる.このほか学習オートマトンにおいても強化学習の研究がみられるが,原理的には勾配法が多いので本稿ではニューラルネットワークに含めて紹介する.それぞれの流れにおいて主流となる学習アルゴリズムや解析手法は異なるが,これらの異なる分野同士で影響を及ぼし合いながら研究が大きく発展してきた.本稿では,おもに1990 年代から近年に至るまでのおよそ20年間の強化学習研究におけるいくつかのエポックメイキング的な手法や解析を中心に紹介し,それらの関係を示すことにより強化学習研究の歩みについて概観する.
机译:强化学习是一种理解和实现目标的学习和决策的计算方法,以及通过与试验和错误的互动学习,区分教师依赖于环境的完整模型的其他学习。这种强化学习被认为是有三个主要流动。作为第一流程,第二分类器系统是神经网络相关研究中的试验和错误学习,第三,第三,马尔可夫确定过程和动态编程的最佳控制问题。除此之外,还在学习自动机中看到了加固学习的研究,但原则上,有许多梯度方法,在本文中,我们在神经网络中介绍它们。虽然每个流程中的主流的学习算法和分析方法是不同的,但在影响这些不同的领域的同时已经大大开发了研究。在本文中,我们主要在我们的20世纪90年代和近年来介绍了几个划时代的方法和分析,主要介绍了它们。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号