首页> 外文会议>Uncertainty in artificial intelligence >Graphical Models for Bandit Problems
【24h】

Graphical Models for Bandit Problems

机译:土匪问题的图形模型

获取原文
获取原文并翻译 | 示例

摘要

We introduce a rich class of graphical models for multi-armed bandit problems that permit both the state or context space and the action space to be very large, yet succinctly specify the payoffs for any context-action pair. Our main result is an algorithm for such models whose regret is bounded by the number of parameters and whose running time depends only on the treewidth of the graph substruc ture induced by the action space.
机译:我们针对多臂匪徒问题引入了丰富的图形模型,这些模型允许状态空间或上下文空间以及动作空间都很大,但可以简洁地指定任何上下文动作对的收益。我们的主要结果是针对此类模型的算法,其后悔受参数数量限制,其运行时间仅取决于由动作空间引起的图结构的树宽。

著录项

  • 来源
  • 会议地点 Barcelona(ES);Barcelona(ES)
  • 作者单位

    Department of Computer and Information Science University of Pennsylvania;

    Department of Computer and Information Science University of Pennsylvania;

    Department of Computer and Information Science University of Pennsylvania;

  • 会议组织
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 人工智能理论;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号