他者の内部状態推定と行動予測を用いた意思決定モデル

佐藤　友美; 大塩　立華; 吉田　和子; 石井　信

首页> 外文期刊>電子情報通信学会技術研究報告 >他者の内部状態推定と行動予測を用いた意思決定モデル

【24h】

他者の内部状態推定と行動予測を用いた意思決定モデル

机译：使用他人的内部状态估计和行为预测的决策模型

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

マルチエージェント環境では，他者の内部状態の変化を相手モデルを用いて推定し，それに基づいて行動を決定することが重要である．近年，マルチエージェント課題遂行中のサルやヒトの行動に対して，相手モデルを含まないモデルフリー強化学習による説明が試みられている．これらの実験では自身の行動・報酬履歴のみから他者の行動が一意に決まる課題設定が用いられているために，自身の意思決定において他者の内部状態変化を明に推定する必要のない課題となっていた．本研究では，他者の行動観測から他者の行動価値を推定可能であり，また行動価値を考慮することにより最適な行動がとれる課題を開発した．被験者の意思決定過程を，相手モデルを考慮したモデル同定強化学習として定式化した．また，本課題を用いてfMRI実験を行うことにより，提案モデルが被験者の行動をよく説明し，さらにモデルに基づく脳活動解析により相手モデルの推定に前頭前野が関わることを検証した．%In multi-agent environments, it may be useful to predict other agent's actions by estimating some sort of internal state of the opponent model. In recent years, model-free reinforcement learning has been used to capture both monkey's and human's behaviors in multi-agent tasks, but such success is attributed to the simple task setting, in which the other agent's action can be determined by the history of subject's own actions and rewards. In this study, we propose a new behavioral task which substantially increases the advantage of estimating the other agent's internal state from action observations. Subjects can select optimal actions based on prediction employing an action-value function. We introduce a model-based reinforcement learning model that well reproduces subject's behaviors in the task. Concurrent evaluation of brain activity using fMRI, in which the cognitive loads are evaluated as regression functions, highlights the role of the prefrontal cortex in the prediction of the other agent.

机译：在多主体环境中，重要的是使用伙伴模型来估计其他人的内部状态的变化，并据此决定行动。近年来，已尝试通过使用不包含伙伴模型的无模型强化学习来解释多主体任务期间猴子和人类的行为。在这些实验中，使用仅根据他人的行为/奖励历史来唯一确定他人行为的任务设置，因此，在做出决策时无需明确估计他人内部状态的变化。它是。在这项研究中，我们开发了一个任务，该任务可以通过观察他人的行为来估计他人的行为值，并可以通过考虑行为值来采取最佳行为。考虑伙伴模型，将受试者的决策过程制定为模型识别强化学习。此外，我们使用该任务进行了功能磁共振成像实验，提出的模型很好地说明了受试者的行为，并通过基于该模型的大脑活动分析验证了前额叶皮层参与了伴侣模型的估计。％在多主体环境中，通过估计对手模型的某种内部状态来预测其他主体的行为可能很有用。近年来，无模型强化学习已被用来捕获猴子和人类在多主体行为中的行为。代理任务，但是这种成功归因于简单的任务设置，在该任务设置中，另一个代理的行为可以通过主体自身的行为和奖励的历史来确定。在本研究中，我们提出了一种新的行为任务，该任务大大增加了测量的优势我们可以使用基于模型的强化学习模型，该模型可以很好地重现任务中受试者的行为。其中认知负荷被评估为回归函数，突出了前额叶皮层在预后预测中的作用。其他代理。

著录项

来源
《電子情報通信学会技術研究報告》 |2008年第413期|p.73-78|共6页
作者
佐藤　友美; 大塩　立華; 吉田　和子; 石井　信;
展开▼
作者单位

奈良先端科学技術大学院大学　〒630-0192 奈良県生駒市高山町8916-5;

京都大学大学院情報学研究科　〒611-0011 京都府宇治市五ケ庄;

Wellcome Trust Centre for Neuroimaging;

UCL;

京都大学大学院情報学研究科　〒611-0011 京都府宇治市五ケ庄;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
マルチエージェント環境; 相手モデル; 機能的核磁気共鳴画像法（fMRI）; 前頭前野;

机译：多主体环境;伙伴模型;功能核磁共振成像（fMRI）;前额叶皮层;
入库时间 2022-08-18 00:36:46

相似文献

外文文献
中文文献
专利

1. 他者の内部状態推定と行動予測を用いた意思決定モデル [J] . 佐藤友美, 大塩立華, 吉田和子, 電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing . 2008,第413期

机译：使用内部状态估计和他人行为预测的决策模型
2. 他者の内部状態推定と行動予測を用いた意思決定モデル [J] . 佐藤友美, 大塩立華, 吉田和子, 電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing . 2008,第413期

机译：决策模型使用其他人的内部状态估计和动作预测
3. 他者の内部状態推定と行動予測を用いた意思決定モデル [J] . 佐藤友美, 大塩立華, 吉田和子, 電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing . 2007,第413期

机译：使用内部状态估计和他人行为预测的决策模型
4. NetLogo を用いた駅コンコースにおける歩行者の行動シミュレーション: 周辺状況による意思決定モデルを用いた検討 - [C] . 森下正道, 大内一昇, 林田和人, 日本建築学会;日本建築学会大会 . 2017

机译：基于NetLogo的车站大厅行人行为模拟：基于周围情况的决策模型检查-
5. アセチルコリンの冠注で誘発されるブタの主および小冠動脈攣縮モデルの開発とこのモデル動物を用いたニプラジロール, イソソルビド?ジニトレート, ブナゾシンの冠攣縮予防効果に関する研究 [D] . Kawamura, Atsushi 1991

机译：冠状动脉注入乙酰胆碱诱导的猪主，小冠状动脉痉挛模型的建立以及尼泊地洛尔，硝酸异山梨酯和布那唑嗪对模型动物的预防作用研究
6. マジョリティとマイノリティが個人の意思決定に及ぼす影響 : 態度と行動の乖離を導入した予測モデル [O] . 野波寛, Hiroshi Nonami 2001

机译：大多数人和少数民族对个体决策的影响：一种引入态度与行为差异的预测模型

他者の内部状態推定と行動予測を用いた意思決定モデル

摘要

著录项

相似文献

相关主题

期刊订阅