線形時相論理制約を満たす定常方策の階層的強化学習

山倉佑馬; 潮俊光

首页> 外文期刊>電子情報通信学会技術研究報告. システム数理と応用. Mathematical Systems Science and its Applications >線形時相論理制約を満たす定常方策の階層的強化学習

【24h】

線形時相論理制約を満たす定常方策の階層的強化学習

机译：線形時相論理制約を満たす定常方策の階層的強化学習

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相关主题

摘要

マルコフ決定過程（MDP）でモデル化されるエージェントに対して線形時相論理式（LTL式）で制御仕様を与え，その制御仕様を満たすような定常方策を求める問題を考える．本報告では，受理条件が遷移集合によって記述される一般化決定的ラビンオートマトン（GDRA）にLTL式を変換し，MDPと合成積をとった合成MDP上で階層的強化学習を用いて，定常方策を学習するアルゴリズムを提案する．さらに，シミュレーションによって，LTL式を満たす定常方策が学習されていることを確認する．

著录项

来源
《電子情報通信学会技術研究報告. システム数理と応用. Mathematical Systems Science and its Applications》 |2017年第301期|117-122|共6页
作者
山倉佑馬; 潮俊光;
展开▼
作者单位

大阪大学大学院基礎工学研究科;

展开▼
收录信息
原文格式 PDF
正文语种日语
中图分类计算机软件;
关键词
階層的強化学習; 線形時相論理式; マルコフ決定過程; 一般化決定的ラビンオートマトン;

線形時相論理制約を満たす定常方策の階層的強化学習

摘要

著录项

相关主题

期刊订阅