decentralized stochastic control; error-bounded approximations;
机译:无限水平对折随机最优控制问题的神经网络近似
机译:针对POMDP和分散式POMDP优化固定大小的随机控制器
机译:非线性随机系统无限水平最优控制的神经近似
机译:无限地平线的误报近似折扣分散的POMDPS
机译:估计个人水平的折现因子并测试竞争性折现假设
机译:在分散的POMDP中使用宏动作进行建模和计划
机译:无限期折扣分散式POMDP的误差有界近似
机译:无限地平线Dec-pOmDp中策略同步的分布式强化学习。