...
机译:双重稳健的政策评估和优化
Microsoft Research, New York, New York, USA;
Google Inc., Mountain View, California, USA;
Microsoft Research, New York, New York, USA;
Microsoft Research, Redmond, Washington, USA;
Contextual bandits; doubly robust estimators; causal inference;
机译:更稳健的双稳健的非政策评估
机译:双馈感应发电机对风力发电的双回路自优化鲁棒控制
机译:基于改进粒子群算法的鲁棒分数阶控制器在双馈异步电机上的应用
机译:对加强学习的双重稳健的脱助政策价值评估
机译:动态鲁棒优化的贸易政策
机译:鲁棒对应物优化的比较理论与计算研究:I。鲁棒线性优化和强大的混合整数线性优化
机译:双重稳健的政策评估与优化
机译:基于多模型策略优化和快速价值功能规划的鲁棒机器人控制。