首页> 外文OA文献 >A Span Seminorm Approach to Controlled Markov Set-Chains
【2h】

A Span Seminorm Approach to Controlled Markov Set-Chains

机译:受控Markov集链的Span半范式方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In a controlled Markov set-chain with finite state and action spaces, we find a policy, called average-optimal, which maximizes Cesaro sums of each timeu27s reward over all stationaly policies under some partial order. Under uniformly scrambling conditions, the dynamic programming operator for our model is proved to be a contraction in a span seminorm. And, analysing the behavior of expected total rewards over the T-horizon as T approaches ∞ by a fixed point of a span-contraction operator we give a constructive proof for the existence of an average-optimal policy.
机译:在具有有限状态和动作空间的受控马尔可夫集合链中,我们找到了一个称为平均最优的策略,该策略在某些局部顺序下,对所有平稳策略的每次奖励的Cesaro总和最大化。在均匀加扰条件下,我们模型的动态规划算子被证明是一个跨半范数的收缩。并且,当跨距收缩算子的一个固定点使T接近∞时,通过分析在T地平线上的预期总报酬的行为,我们为平均最优策略的存在提供了建设性的证据。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号