首页> 外文会议>システム研究会 >予想失敗確率を組み込hだ行動選択戦略の提案とマルチエージェント環境下での有効性の検証
【24h】

予想失敗確率を組み込hだ行動選択戦略の提案とマルチエージェント環境下での有効性の検証

机译:采用嵌入行为选择策略嵌入行为的多智能经纪环境中的行动选择策略和验证效果的提案

获取原文

摘要

近い将来,ロボットがますます人間の生活環境に進出してくることが予想される.しかし,人間の生活環境は,不確実性,協調行動,実時間制御などの環境が激しく変化することから,設計者がすべての状況を想定した設計をすることは非常に困難である.そのため,ロボットが自ら知覚した情報と経験した行動を元に,自身で環境に適応する能力を持つことが必要となってくる.このような,不確実性を持った環境にロボットが適応するための手法として,強化学習がある.強化学習は,報酬という試行に対する評価値を手掛かリとして,試行錯誤を行い,環境に適応する機械学習の一種である.強化学習では,目的を達成するための試行錯誤を行うことから,設計者の予想を超えた解を発見する可能性がある.また,穏やかな環境の変化には追従が可能である.
机译:在不久的将来,预计机器人将在人类生活的生活环境中越来越多。但是,人类生活环境发生剧烈,如不确定性,协调的行为,实时控制等。设计师非常困难设计所有情况。因此,有必要基于机器人感知和经验丰富的信息的动作来适应环境本身。有一种加强学习作为机器人的方法,以适应这种不确定性环境。增强学习是一种试验和错误,作为奖励的评估价值的一种试验,它是一种适应环境的机器学习。通过加强学习,我们可能会发现除了设计师的期望之外,我们可能会发现超越设计师的期望达到目的的试验和错误。此外,在轻度环境中,可以遵循更改。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号