予想失敗確率を組み込hだ行動選択戦略の提案とマルチエージェント環境下での有効性の検証

机译：采用嵌入行为选择策略嵌入行为的多智能经纪环境中的行动选择策略和验证效果的提案

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

近い将来，ロボットがますます人間の生活環境に進出してくることが予想される.しかし，人間の生活環境は，不確実性，協調行動，実時間制御などの環境が激しく変化することから,設計者がすべての状況を想定した設計をすることは非常に困難である.そのため，ロボットが自ら知覚した情報と経験した行動を元に，自身で環境に適応する能力を持つことが必要となってくる.このような，不確実性を持った環境にロボットが適応するための手法として，強化学習がある.強化学習は，報酬という試行に対する評価値を手掛かリとして，試行錯誤を行い,環境に適応する機械学習の一種である.強化学習では，目的を達成するための試行錯誤を行うことから，設計者の予想を超えた解を発見する可能性がある.また，穏やかな環境の変化には追従が可能である.

机译：在不久的将来，预计机器人将在人类生活的生活环境中越来越多。但是，人类生活环境发生剧烈，如不确定性，协调的行为，实时控制等。设计师非常困难设计所有情况。因此，有必要基于机器人感知和经验丰富的信息的动作来适应环境本身。有一种加强学习作为机器人的方法，以适应这种不确定性环境。增强学习是一种试验和错误，作为奖励的评估价值的一种试验，它是一种适应环境的机器学习。通过加强学习，我们可能会发现除了设计师的期望之外，我们可能会发现超越设计师的期望达到目的的试验和错误。此外，在轻度环境中，可以遵循更改。

著录项

来源
《システム研究会》|2016年|43 p.|共7页
会议地点
作者
古川　耕大; 宮崎　和光; 小林　博明;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类电磁学、电动力学;
关键词
マルチエージェント学習; 同時学習問題; Profit Sharing; Expected Failure Probability; 強化学習; Keepaway task;

机译：多代理学习;同时学习问题;利润分享;预期失败概率;加强学习;LeepAway任务;

相似文献

外文文献
中文文献
专利

1. エージェント選択戦略によるマルチエージェントシステムの効率と構造について [J] . 菅原　俊治, 栗原　聡, 佐藤　進也, 電子情報通信学会論文誌, D. 情報·システム . 2007,第3期

机译：基于代理选择策略的多代理系统效率与结构
2. 生物の集団的行動選択の仕組みに着想を得たマルチエージェント自己組織化制御手法の検討 [J] . 志垣沙衣子, 久世尚美, 小南大智, 電子情報通信学会技術研究報告. 情報ネットワ-ク. Information Networks . 2016,第485期

机译：检查群体行为选择的多助剂自组织控制方法的研究
3. 周波数選択性フェージング環境下でのブロック対角化に基づくマルチユーザMIMO-OFDM伝送におけるクリッピング・フィルタリングに基づく高効率ピーク電力抑圧法 [J] . 木村　亮介, 樋口　健一電子情報通信学会技術研究報告 . 2011,第369期

机译：频率选择性衰落环境下基于对角化的多用户MIMO-OFDM传输中基于削波滤波的有效峰值功率抑制方法
4. 予想失敗確率を組み込hだ行動選択戦略の提案とマルチエージェント環境下での有効性の検証 [C] . 古川　耕大, 宮崎　和光, 小林　博明システム研究会 . 2016

机译：在包含预期失败概率的多主体环境中，采取行动选择策略并验证有效性
5. アセチルコリンの冠注で誘発されるブタの主および小冠動脈攣縮モデルの開発とこのモデル動物を用いたニプラジロール, イソソルビド?ジニトレート, ブナゾシンの冠攣縮予防効果に関する研究 [D] . Kawamura, Atsushi 1991

机译：冠状动脉注入乙酰胆碱诱导的猪主，小冠状动脉痉挛模型的建立以及尼泊地洛尔，硝酸异山梨酯和布那唑嗪对模型动物的预防作用研究
6. 不確定環境下におけるマルチエージェントの意志決定と協調行動 [O] . 崔暁巍 2016

机译：不确定环境中的多主体决策和合作行为

予想失敗確率を組み込hだ行動選択戦略の提案とマルチエージェント環境下での有効性の検証

摘要

著录项

相似文献

相关主题

期刊订阅