首页> 外文会议>ヒューマンインタフェース学会研究会;ヒューマンインタフェース学会 >他者の行動の予測を促進する行動特性の研究: 強化学習を用いた行動モデリング
【24h】

他者の行動の予測を促進する行動特性の研究: 強化学習を用いた行動モデリング

机译:促进地球行为预测的行为特征研究:利用加固学习的行为建模

获取原文

摘要

私たちが社会生活を送る上で,周囲の反応や意図を読み取り,自身の振る舞い方を柔軟に調整することが時に重要となる.こうした営みは他者の行動を予測する認知機能によって支えられている.同時に,他者が自身の行動を予測しやすいように振る舞うことも,円滑なコミュニケーションを促す鍵となると考えられる.では,他者にとって予測しやすい行動とは,具体的にはどのような特性が考えられるだろうか.例えば,自動車の運転において周囲のドライバーに進路を譲る際には,相手が発進するまで減速し続ける,あるいは停止して待つなどして相手にサインを送ることで事故のリスクを回避することができる.このように自身の行動パターンを一貫させることは,互いに協調的な行動を促す機能を持つと言える .意思決定研究において,同じ行動選択を繰り返す傾向については強化学習の枠組みで検討されてきた.強化学習とは,選択の結果として得られる報酬に基づいて行動価値を計算し,適切な選択を逐次的に学習していく過程である.しかし,実際の人間の意思決定とは常に合理的な価値計算に基づいて行われるとは限らない.「前回も選hだからもう一度選hでみる」というように過去に自身がとった行動からも影響を受ける.これまで,価値とは無関係に同じ選択を繰り返す傾向である固執性(perseverance) は意思決定におけるノイズとして捉えられてきたため,その社会的機能については十分に検討されてこなかった.そこで本研究では,固執性が他者の行動の予測を促進する可能性について議論する.
机译:当我们阅读周围环境并阅读意图时,我们有时很重要,并灵活地调整自己的行为。这种工作得到了一种认知函数,预测他人的行为。同时,认为其他人表现得以容易地预测它们的行为,并且被认为是促进平滑通信的关键。那么,其他人可以特别考虑什么样的特征。例如,当将课程转移到汽车驾驶中的围绕驱动器时,可以通过继续减速或停止直到另一方开始等来降低事故的风险。如这有能力鼓励自己的行为模式来鼓励他们的合作行为。在决策研究中,在加固学习框架中考虑了重复相同行为选择的趋势。 Reinforcement learning is a process of calculating the behavioral value based on the rewards obtained as a result of selection and learning appropriate selection sequentially.但是,实际的人类决策并不总是基于合理的价值计算。 “因为这是第一次,我会再次尝试看到它,我会再试一次。”过去也受到了自己的影响。到目前为止,它已被视为决策中的噪音,因为它被认为是决策中的噪音,因为它被认为是在决策中被视为噪音。因此,在这项研究中,我们将讨论促进促进他人行为的预测的可能性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号