首页> 外文期刊>European Economic Review >Observational and reinforcement pattern-learning: An exploratory study
【24h】

Observational and reinforcement pattern-learning: An exploratory study

机译:观测和强化模式 - 学习:探索性研究

获取原文
获取原文并翻译 | 示例
           

摘要

Understanding how individuals learn in an unknown environment is an important problem in economics. We model and examine experimentally behavior in a very simple multi armed bandit framework in which participants do not know the inter-temporal payoff structure. We propose a baseline reinforcement learning model that allows for pattern recognition and change in the strategy space. We also analyse three augmented versions that accommodate observational learning from the actions and/or payoffs of another player. The models successfully reproduce the distributional properties of observed discovery times and total payoffs. Our study further shows that when one of the pair discovers the hidden pattern, observing another's actions and/or payoffs improves discovery time compared to the baseline case. (C) 2018 Published by Elsevier B.V.
机译:了解个人在未知环境中如何学习是经济学中的重要问题。 我们在一个非常简单的多武装强盗框架中进行模型并检查实验行为,其中参与者不知道时间间收益结构。 我们提出了一种基线强化学习模型,可以实现模式识别和变化策略空间。 我们还分析了三种增强版本,可容纳来自其他玩家的行动和/或收益的观察学习。 该模型成功地再现了观察到的发现时间和总回报的分布属性。 我们的研究进一步表明,当该对中的一个发现隐藏的模式时,观察另一个行动和/或收益,与基线情况相比改善了发现时间。 (c)2018由elsevier b.v发布。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号