...
首页> 外文期刊>Theoretical computer science >New bounds on the price of bandit feedback for mistake-bounded online multiclass learning
【24h】

New bounds on the price of bandit feedback for mistake-bounded online multiclass learning

机译:用于错误的在线多种单位学习的强盗反馈价格的新界限

获取原文
获取原文并翻译 | 示例
           

摘要

This paper is about two generalizations of the mistake bound model to online multiclass classification. In the standard model, the learner receives the correct classification at the end of each round, and in the bandit model, the learner only finds out whether its prediction was correct or not. For a set F of multiclass classifiers, let opt(std)(F) and opt(bandit)(F) be the optimal bounds for learning F according to these two models. We show that an
机译:本文是关于在线多字符分类的错误绑定模型的两个概括。 在标准模型中,学习者在每轮末端接收正确的分类,并在强盗模型中,学习者只发现其预测是否正确。 对于多条比例分类器的组F,让选择(STD)(F)和OPT(BANDIT)(F)是根据这两个模型学习F的最佳限制。 我们展示了一个

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号