首页> 外文期刊>Problems of information transmission >One-armed bandit problem for parallel data processing systems
【24h】

One-armed bandit problem for parallel data processing systems

机译:并行数据处理系统的单臂强盗问题

获取原文
获取原文并翻译 | 示例
           

摘要

We consider the minimax setting for the one-armed bandit problem, i.e., for the two-armed bandit problem with a known distribution function of incomes corresponding to the first action. Incomes that correspond to the second action have normal distribution functions with unit variance and an unknown mathematical expectation. According to the main theorem of game theory, the minimax strategy and minimax risk are sought for as Bayesian, corresponding to the worst-case prior distribution. Results can be applied to parallel data processing systems if there are two processing methods available with an a priori known efficiency of the first.
机译:我们考虑单臂强盗问题的最小最大值设置,即针对具有与第一个动作相对应的已知收入分配函数的两臂强盗问题。对应于第二个动作的收入具有正态分布函数,具有单位方差和未知的数学期望。根据博弈论的主要定理,寻求最小最大策略和最小最大风险作为贝叶斯,对应于最坏情况的先验分布。如果存在两种处理方法,并且先验效率已知,则可以将结果应用于并行数据处理系统。

著录项

  • 来源
    《Problems of information transmission》 |2015年第2期|177-191|共15页
  • 作者

    Kolnogorov A. V.;

  • 作者单位

    Yaroslav The Wise Novgorod State Univ, Appl Math & Informat Sci Dept, Veliky Novgorod, Russia;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号