Profit Sharing強化学習法における動的強化関数の設計法

中野秀洋; 宮内新; Hidehiro NAKANO; Arata MIYAUCHI

首页> 外文期刊>電子情報通信学会技術研究報告. 非線形問題. Nonlinear Problems >Profit Sharing強化学習法における動的強化関数の設計法

【24h】

Profit Sharing強化学習法における動的強化関数の設計法

机译：利益共享如何在强化学习方法中设计动态强化功能

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本稿では，Profit Sharing強化学習法において用いられる強化関数の設計法について検討する．様々な静的または動的な強化関数に対して，学習の合理性と学習効率に関しての理論的な考察を行う．また，本稿で考察する強化関数の枠組みの中で，従来法よりも簡素な動的強化関数を用いた学習法の提案も行う．いくつかの例題タスクを用いた数値実験を行い，各手法における学習性能を比較する．

机译：在本文中，我们研究了在“利润共享”强化学习方法中使用的强化函数的设计方法。我们从理论上考虑了各种静态或动态增强功能的学习合理性和学习效率。另外，在本文讨论的强化函数的框架内，我们还提出了一种使用动态强化函数的学习方法，该方法比常规方法简单。使用一些示例任务进行了数值实验，并比较了每种方法的学习性能。

著录项

来源
《電子情報通信学会技術研究報告. 非線形問題. Nonlinear Problems》 |2007年第574期|共6页
作者
中野秀洋; 宮内新; Hidehiro NAKANO; Arata MIYAUCHI;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类通信;
关键词
強化学習; 強化関数; 経験強化型; profit sharing; Reinforcement learning; reinforcement function; exploitation-oriented; profit sharing;

机译：强化学习;强化功能;体验强化类型;利润分享;强化学习;强化功能;以开发为导向;利益共享;

相似文献

外文文献
中文文献
专利

1. Profit Sharing強化学習法における動的強化関数の設計法 [J] . 中野秀洋, 宮内新, Hidehiro NAKANO, 電子情報通信学会技術研究報告. 非線形問題. Nonlinear Problems . 2007,第574期

机译：利益共享如何在强化学习方法中设计动态强化功能
2. Profit Sharing強化学習法における動的強化関数の設計法 [J] . 中野秀洋, 宮内新, Hidehiro NAKANO, 電子情報通信学会技術研究報告. 非線形問題. Nonlinear Problems . 2006,第574期

机译：利益共享如何在强化学习方法中设计动态强化功能
3. Profit Sharing強化学習法における動的強化関数の設計法 [J] . 中野秀洋, 宮内新, Hidehiro NAKANO, 電子情報通信学会技術研究報告. 非線形問題. Nonlinear Problems . 2006,第574期

机译：利润共享增强学习方法动态增强功能的设计方法
4. 等価線形化法による制震補強設計法に関する研究(その1 制震補強設計法の概要および各層のダンパー量の算定) [C] . 歌田航己, 森本竜, 山崎康雄, 日本建築学会;日本建築学会大会 . 2018

机译：用等效线性化方法研究抗震加固设计方法（第1部分，抗震加固设计方法概述和每层阻尼量的计算）
5. モデルベース深層強化学習におけるタスク依存の中間表現を用いた環境遷移モデルの学習利用統計を見る [D] . 水谷陽太 2019

机译：在基于模型的深度强化学习中查看使用任务相关中间表示的环境过渡模型的学习使用情况统计信息
6. 〔第 3 篇〕 EB 附加による再化学療法の強化(2,2'-(Ethylenediimino)-di-1-butanol (EB) の抗結核作用並びに EB 附加による再化学療法強化に関する基礎的研究) [O] . 岩井嘉一 1966

机译：（第3部分）增强EB化疗（2,2'-（乙烯二亚氨基）-二-1-丁醇（EB）的抗结核作用基础研究和增强EB的化疗）

Profit Sharing強化学習法における動的強化関数の設計法

摘要

著录项

相似文献

相关主题

期刊订阅