マルチエージェント連続タスクにおける報酬設計の実験的考察－RoboCup Soccer Keepaway タスクを例として

荒井幸代; 田中信行; Sachiyo Arai; Nobuyuki Tanaka

首页> 外文期刊>人工知能学会論文誌 >マルチエージェント連続タスクにおける報酬設計の実験的考察－RoboCup Soccer Keepaway タスクを例として

【24h】

マルチエージェント連続タスクにおける報酬設計の実験的考察－RoboCup Soccer Keepaway タスクを例として

机译：多Agent连续任务中奖励设计的实验考虑-以RoboCup足球禁忌任务为例

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本論文では，keepawayにおける従来の報酬設計の問題点を，いくつかの実験を通じて指摘し，これに代わる報酬設計法を提案する．また，提案手法によってボールキープ時間が大幅に改善される理由を考察し，マルチエージェント連続タスクの報酬設計法の指針を与えることを目的とする．以下，第2章では，keepawayの問題設定と，強化学習を適用する際の問題の特徴を述べる．第3章では，keepawayを例として，マルチエージェント系における連続タスクにおいて考慮すべき報酬設計問題を列挙し，このタイプのタスクに適した報酬設計を提案する．第4章では実験方法，および，提案した報酬設計法と従来法による性能を，キープ時間の長さと獲得された行動の側面から比較する．また，5章では提案手法の妥当性を考察し，本タスクにおける報酬設計指針をまとめる．最後に第6章で結論と今後の課題を述べる．

机译：本文通过一些实验指出了传统的奖励设计存在的问题，并提出了一种替代的奖励设计方法。本研究的目的是考虑提出的方法显着改善控球时间的原因，并为多主体连续任务的奖励设计方法提供指导。在第2章中，我们描述了强化学习的问题设置以及应用强化学习时问题的特征。在第3章中，以保持距离为例，我们列出了多智能体系统中连续任务要考虑的奖励设计问题，并提出了适合此类任务的奖励设计。第四章从保持时间的长短和获得的行为两个方面比较了实验方法和所提出的奖励设计方法与常规方法的性能。在第5章中，我们考虑了所提出方法的有效性，并总结了该任务的奖励设计准则。最后，第6章介绍了结论和未来的问题。

著录项

来源
《人工知能学会論文誌》 |2006年第6期|共10页
作者
荒井幸代; 田中信行; Sachiyo Arai; Nobuyuki Tanaka;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类人工智能理论;
关键词
Multiagent systems; Robocup soccer; Keepaway; Reinforcement learning; Reward design;

机译：Multiagent系统;Robocup足球;Keepaway;强化学习;奖励设计;

相似文献

外文文献
中文文献
专利

1. マルチエージェント連続タスクにおける報酬設計の実験的考察－RoboCup Soccer Keepaway タスクを例として [J] . 荒井幸代, 田中信行, Sachiyo Arai, 人工知能学会論文誌 . 2006,第6期

机译：多Agent连续任务中奖励设计的实验考虑-以RoboCup足球禁忌任务为例
2. 沖縄県宮古島市では、島嶼型スマートコミュニティ実証事業というプロジヱクト（以下：本プロジェクト）を進めている。本プロジェクトは、宮古島の気候や地形、地質などの自然的特性、本土や沖縄本島から遠く離れた離島に位置するという地理的特性、産業構造や市民性等の社会的特性などを前提に、エネルギーの使い方に着目し、島の特性における弱点を克服しながら、島ならではの優位性を最大限に活用して持続可能な社会システムの実現に挑戦する。IoTセキユリティガイドラインソver1.0 [J] . 渡邊　昇治総合電気雑誌 . 2017,第4期

机译：在冲绳县宫古岛市，我们正在推广一个名为智能岛社区示范项目的项目（以下简称该项目）。该项目基于宫古岛的自然特征，例如气候，地形和地质，位于远离大陆和冲绳本岛的偏远岛屿上的地理特征，以及工业结构和公民身份等社会特征。着眼于如何利用能源，克服岛屿特征上的弱点，我们将通过最大程度地提高岛屿的独特性来实现可持续的社会体系。物联网安全指南软件ver1.0
3. NTTら業界団体を設立光通信技術を研究日本電信電話(株)(NTT、東京都千代田区)、米インテル、ソ二ー(株)(東京都港区)の3社は、新たな業界団体を設立する。光電融合技術を活用したフォトニクス関連技術の研究開発などを推進し、超大容量通信に対応できる光ネットヮーク技術の確立などを目指してハる。3-3プロセッシング領域狙う国内DRAM大手のェルピーダメモリを買収し、大きく飛躍を遂げた米マイクロンテクノロジー。2017年にはサンディスク共同創業者の1人である、Sanjay Mehrotra (サンジエイ·メイロトラ)氏を招聘。経営体制も刷新され、大きく生まれ変わった「新生マイクロン」を全面に押し出した。米サンフランシスコで開催されたプライベートイベント「MlicronInsight 2019」(現地10月24日開催)では、同社のあるべき将来像に対するメッセージが随所に散りばめられていた。 [J] . 半導体産業新聞 . 2019,第2372期

机译：成立了NTT和其他工业集团研究光通信技术的日本电报电话公司（NTT，东京千代田区），英特尔，索尼公司（东京都港区）是三个新的工业集团。建立。促进利用光电子融合技术的光子相关技术的研究和开发，并致力于建立可支持超高容量通信的光网络技术。 3-3处理领域美国Micron Technology在收购了国内主要DRAM公司Elpida Memory之后取得了巨大飞跃。 2017年，我们邀请了Sanjay联合创始人Sanjay Mehrotra。管理系统也进行了改进，我们推出了完全脱胎换骨的“新Micron”。在旧金山举行的私人活动“ Mlicron Insight 2019”（10月24日举行）上，有关公司未来愿景的信息四处散布。
4. オーストリアの自治体におけるエネルギー•パフォーマンス•コントラクティング·プロジェクト: フライシュタツトを事例地として [C] . 前野　真吾, 糸長　浩司日本建築学会大会 . 2008

机译：奥地利市的能源绩效承包项目：以弗赖施塔特为例
5. スパイキングニューラルネットワークによる連想記憶モジュールとデジタルコンピュータ間のインターフェース利用統計は来月からご利用いただけます [D] . 豊島尚樹 2019

机译：下个月将提供使用尖峰神经网络的关联存储模块和数字计算机之间的接口使用情况统计信息。
6. <論説>ワーク・ライフ・バランスのための非ジェンダー的法律が、いかにジェンダー的効果を生んだか : 20世紀最後の四半世紀におけるベルギーのタイムクレジット制度とキャリアブレイク制度、およびそれらが女性のライフスタイルに及ぼした影響について [O] . FREY Urszula 2014

机译：
工作与生活平衡的非性别法律如何产生性别影响：20世纪下半叶比利时的时间积分和职业中断制度及其对女性生活方式的影响关于影响

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

客服微信
服务号

マルチエージェント連続タスクにおける報酬設計の実験的考察－RoboCup Soccer Keepaway タスクを例として

摘要

著录项

相似文献

相关主题

期刊订阅