段階的にサブゴールを獲得するStepwise Unified Hierarchical Reinforcement Learningの提案

机译：逐步的子目标的逐步统一的分层强化学习建议

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

強化学習とは，エージェントが，観測可能な環境に対する適切な行動系列を確率的に学習する機械学習手法の1つである．エージェントは，設計者が環境に設定した報酬を元に，それを最大にするような行動を選択するように学習する．そのため，試行錯誤的に望ましい行動系列を学習できるが，長期的な戦略を必要とする行動系列の学習は困難であることが知られている．

机译：强化学习是代理可以观察的环境。一种机器学习方法，可以概率地学习适当的行为顺序这是其中之一。代理由设计者在环境中设置根据奖励选择使之最大化的动作像这样学习。因此，期望的行为是通过反复试验得出的可以学习序列但需要长期策略的行为系统众所周知，列学习是困难的。

著录项

来源
《情報処理学会;情報処理学会全国大会》|2020年|2.571-2.572|共2页
会议地点
作者
黒須　宏道; 真部　雄介; 菅原　研次;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. オーナーが管理会社に期待すること(実践編): 施設管理がビルのブランドカを決定する第11回設計段階からの管理委託がローコスト管理への近道(その2)(管理業務の経験と知識を活かし提案型の管理業務) [J] . 石山　恭市无_下水道情報 . 2021,第9期

机译：业主期望管理公司行政建议管理业务）
2. 事務所ビルにおけるシミュレーションと実測を用いたライフサイクルエネルギーマネジメントに関する研究第1報: 企画•計画段階〜運用段階へのLCEMッ一ルの適用と実測との比較 [J] . 篠田拓也, 中田達也, 木幡悠士, 空気調和·衛生工学会論文集 . 2020,第275期

机译：办公大楼中使用模拟和测量进行生命周期能源管理的研究第一报告：LCEM工具从计划/规划阶段到运营阶段的应用以及与实际测量的比较
3. 真言宗豊山派観音寺馬場下町の交差点から早大南門通りを下ると、大隈記念講堂に突き当たる。さらに、キャンパスの外塀沿いに大隈通り商店街へ歩みを進めると、小規模な商店やテナントビル、アパートなどが密集するェリアに埋もれて、大きな折板屋根の一部が見えてくる。その他にも、赤い自立壁、屈曲する大階段に沿う巨大な雨樋、屋根ゃ大階段のテラコッタ、等々……。ー見、何の建物だか判別できないが、門前に建つ寺号標によって、お寺の本堂だと知らされる。 [J] . GA Japan . 2020,第163期

机译：从新宫佛教寺院，富山团体观音寺八桥下町的交汇处往早稻田南门街下，您将遇到大沼纪念堂。此外，当您沿着校园的外墙步行到大uma通商店街时，您将能够看到大型折叠式屋顶的一部分，该屋顶埋在许多小商店，租户建筑物，公寓等拥挤的区域。除此之外，还有红色的自支撑墙，弯曲的楼梯旁的巨大雨水槽，兵马俑的屋顶和楼梯等。 -您无法分辨出它是哪种建筑，但大门前的庙宇标志告诉您这是庙宇的正殿。
4. サーバ室を持つ事務所ビルのライフサイクルエネルギーマネジメントに関する研究その２ LCEM ツールを用いた設計段階における熱源・空調システムの性能評価 [C] . 中田達也, 木幡悠士, 柳正秀, 日本建築学会大会;日本建築学会 . 2013

机译：具有服务器机房的办公楼生命周期能源管理研究第二部分，使用LCEM工具在设计阶段对热源和空调系统的性能评估
5. シミュレーションを活用した病院熱源システムの運用段階のエネルギーマネジメント手法に関する研究 [D] . 千葉理恵, CHIBA Rie 2019

机译：医院热源系统运行阶段能耗管理方法的仿真研究
6. 製品設計時にて考慮すべきエラープルーフによるユーザの使用段階でのトラブル未然防止 [O] . 青木健 2016

机译：通过在设计产品时应考虑的防错措施来防止在用户使用阶段出现问题

段階的にサブゴールを獲得するStepwise Unified Hierarchical Reinforcement Learningの提案

摘要

著录项

相似文献

相关主题

期刊订阅