Concurrent Q Learning における Relaxation の 改良

村上和謙; 尾関智子

首页> 外文期刊>電子情報通信学会技術研究報告 >Concurrent Q Learning における Relaxation の改良

【24h】

Concurrent Q Learning における Relaxation の改良

机译：并行Q学习中放松的改进

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

In this study, we point out problems and suggest the modification of relaxation in CQL-e which is one of the adaptation techniques to dynamic environment in the reinforcement learning. In reinforcement learning in maze, we validate what kind of behavior conventional techniques and proposal techniques show for the change of a destination or the obstacle. Reinforcement learning; Dynamic%本研究では，強化学習における動的環境への適応手法の一つであるCQL-eにおけるrelaxationの問題点を指摘し，その改善策を提案する.迷路問題において，ゴールまたは障害物の変化に対し，従来手法と提案手法がどのような挙動を示すかを比較する.

机译：在这项研究中，我们指出了问题并提出了对CQL-e放松的修改，这是强化学习中对动态环境的适应技术之一。在迷宫强化学习中，我们验证了常规行为和提议技术是什么样的行为强化学习；动态％在本研究中，我们指出了CQL-e中的松弛问题，它是强化学习中对动态环境的适应方法之一，并对其进行了改进。在迷宫问题中，我们比较了传统方法和建议方法相对于目标或障碍物变化的行为。

著录项

来源
《電子情報通信学会技術研究報告》 |2013年第480期|209-213|共5页
作者
村上和謙; 尾関智子;
展开▼
作者单位

東海大学工学研究科情報理工学専攻　〒259-1292　神奈川県平塚市北金目4-1-1;

東海大学情報理工学部情報科学科　〒259-1292　神奈川県平塚市北金目4-1-1;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
強化学習; 動的環境; Concurrent Q learning;

机译：强化学习;动的环境;Concurrent Q learning;

相似文献

外文文献
中文文献
专利

1. Concurrent Q learningにおけるrelaxationの改良 [J] . 村上和謙, 尾関智子電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing . 2012,第480期

机译：改善并行Q学习中的放松
2. Concurrent Q learningにおけるrelaxationの改良 [J] . 村上和謙, 尾関智子電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing . 2012,第480期

机译：同时Q学习的放松的改进
3. 我が国における地盤改良技術の変遷3．未改良の埋立地や低平地における地盤沈下への対応 [J] . 今西肇, 杉山太宏材料 . 2016,第10期

机译：日本地面改善技术的转变。在低地的不可移动垃圾填埋场和低地回应
4. 電気分解法電気分解法電気分解法電気分解法電気分解法を用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用いた水溶媒中における金属亜鉛ナノ粒子のを用 [C] . 古川悟, 山内紀子, 中島光一化学工学会秋季大会 . 2020

机译：电解法电解法电解法的金属锌纳米颗粒在水性溶剂中，使用金属锌纳米颗粒使用金属锌纳米颗粒使用利用金属锌纳米颗粒使用金属锌纳米颗粒使用金属锌纳米颗粒使用金属锌纳米颗粒使用电解法的金属锌纳米颗粒在水性溶剂中的金属锌纳米颗粒在水性溶剂中使用金属锌纳米粒子在水性锌纳米粒子使用金属锌纳米粒子使用金属锌纳米颗粒，使用金属锌纳米粒子在水性锌纳米粒子中使用金属锌纳米粒子在水性中使用金属锌纳米粒子使用金属锌纳米颗粒，使用金属锌纳米颗粒在水性溶剂中使用的金属锌纳米颗粒。使用金属锌纳米粒子使用金属锌纳米颗粒在水性锌纳米粒子中使用金属锌纳米粒子在水性溶剂中使用金属锌纳米颗粒溶剂溶剂
5. 積雪寒冷環境における地盤改良および補強土工法の設計?施工?維持管理方法に関する研究 [D] . 橋本聖 2019

机译：寒雪环境中地基改良土法的设计，施工与养护方法研究
6. Learning Kernels for variants of Normalized Cuts: Convex Relaxations and Applications [O] . Lopamudra Mukherjee, Vikas Singh, Jiming Peng, -1

机译：学习内核的标准化切割的变体：凸松弛及应用
7. 酸化銅及び還元銅の接触の下における炭酸ガスの熱解離並に窒素微量定量分析における燃焼法の改良について [O] . 1953

机译：氮氧化铜和铜的二氧化二氧化二氧化二氧化二氧化分析中氮痕量定量分析中氮痕量分析的燃烧方法

Concurrent Q Learning における Relaxation の 改良

摘要

著录项

相似文献

相关主题

期刊订阅

Concurrent Q Learning における Relaxation の改良