首页> 外文期刊>電子情報通信学会技術研究報告. 非線形問題. Nonlinear Problems >Profit Sharing強化学習法における動的強化関数の設計法
【24h】

Profit Sharing強化学習法における動的強化関数の設計法

机译:利益共享如何在强化学习方法中设计动态强化功能

获取原文
获取原文并翻译 | 示例
           

摘要

本稿では,Profit Sharing強化学習法において用いられる強化関数の設計法について検討する.様々な静的または動的な強化関数に対して,学習の合理性と学習効率に関しての理論的な考察を行う.また,本稿で考察する強化関数の枠組みの中で,従来法よりも簡素な動的強化関数を用いた学習法の提案も行う.いくつかの例題タスクを用いた数値実験を行い,各手法における学習性能を比較する.
机译:在本文中,我们研究了在“利润共享”强化学习方法中使用的强化函数的设计方法。我们从理论上考虑了各种静态或动态增强功能的学习合理性和学习效率。另外,在本文讨论的强化函数的框架内,我们还提出了一种使用动态强化函数的学习方法,该方法比常规方法简单。使用一些示例任务进行了数值实验,并比较了每种方法的学习性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号