Univ Washington Dept Elect Engn Seattle WA 98195 USA;
Univ Calif Berkeley Dept Elect Engn & Comp Sci Berkeley CA 94720 USA;
Autonomous systems; Markov processes; optimization; reinforcement learning;
机译:通过半参数和非参数方法进行风险敏感的逆向强化学习
机译:利用强化学习和深度逆钢筋学习的自治车辆先进规划
机译:风险敏感强化学习
机译:基于梯度的逆风险敏感强化学习
机译:用于学习双模对话策略的最大最大逆钢筋学习
机译:神经预测错误揭示了人脑中风险敏感的强化学习过程
机译:半经济和风险敏感的逆向强化学习 非参数方法