【24h】

強化学習における典型系列について

机译:強化学習における典型系列について

获取原文
获取原文并翻译 | 示例
       

摘要

本論では強化学習の経験系列において成り立つ漸近等分割性を示す。 これは時間ステップ数が十分に大きければ,経験系列の典型集合がほぼ確率1で出現すること,典型集合中の経験系列がほぼ同じ確率で出現すること,典型集合の大きさが条件付きエントロピーの指数関数で与えられることを表している。 この性質は強化学習の学習過程を解析するために大変役に立つ。

著录项

获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号