首页> 外文会议>精密工学会秋季大会学術講演会 >多リンクロボットの経路決定を行う強化学習に関する研究-状態価値を用いて状態空間を構築する強化学習
【24h】

多リンクロボットの経路決定を行う強化学習に関する研究-状態価値を用いて状態空間を構築する強化学習

机译:钢筋学习研究确定多链接机器人增强学习,使用状态值构建状态空间

获取原文

摘要

環境の状態が連続的である現実問題を扱う強化学習において,過去に遭遇した状態と全く同じ状態に遭遇することはほとhどないため,類似した状態を集めたクラスタ単位で学習を進める必要がある.また,学習を通して適切な状態空間を自動的に構築できることが必要である.Fuzzy-ARTは漸増的状態空間構築法であり,強化学習における状態判別器として利用できる.Fuzzy-ARTは遭遇した状態を既存のカテゴリに分類するが,もし適切なカテゴリが無い場合は,新たなカテゴリを生成する.しかし,状態空間を遭遇頻度の高い領域ほど細かく分割するものの,その領域の重要度を考慮したものではない.また,カテゴリは単調増加するため,多数のタスクを学習させる場合にカテゴリの増大を招く.よって本研究では,状態価値に基づいて状態空間分割サイズの変更し,さらに重要度の低いカテゴリを整理できるようにFuzzy-ARTを改良した.そして,これを状態判別器に用いた強化学習法を提案する.
机译:在加强学习中,处理环境条件是连续的现实问题,有必要遇到与过去遇到的国家相同的状态,因此我们需要在集群单元中学习收集在那里类似的条件。还有必要通过学习自动构建适当的状态空间。模糊艺术是一种增量状态空间施工方法,可作为强化学习中的状态鉴别器。模糊领域将遇到的状态分类为现有类别,但如果没有适当的类别,则创建一个新类别。然而,尽管状态空间被分成次要区域作为遇到频率,但不考虑该区域的重要性。此外,由于该类别单调增加,所以在学习大量任务时,该类别增加。因此,在本研究中,我们改变了模糊领域,使得基于状态值改变状态空间分割大小,并且可以组织较低程度的重要性。然后,我们提出了一种使用这一点的加强学习方法,用于状态鉴别器。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号