机译:最小绝对策略迭代-价值函数逼近的稳健方法
Department of Computer Science, Tokyo Institute of Technology, Tokyo, 152-8552 Japan PRESTO, Japan Science and Technology Agency, Tokyo, 152-8552 Japan;
rnDepartment of Computer Science, Tokyo Institute of Technology, Tokyo, 152-8552 Japan;
rnDepartment of Mathematical Informatics, the University of Tokyo, Tokyo, 113-8656 Japan;
rnIBM Research - Tokyo, Yamato-shi, 242- 8502 Japan;
reinforcement learning; value function approximation; least- squares policy iteration; outlier; l-loss function; linear programming;
机译:最小绝对策略迭代-价值函数逼近的稳健方法
机译:逐次逼近的非绝对积分方法
机译:基于绝对值函数的有理逼近的一类不完全Riemann解。
机译:最小绝对策略迭代,用于鲁棒值函数逼近
机译:通过Green函数方法分析再现核逼近方法
机译:遗传网络约简NGnet模型推论的函数逼近方法
机译:鲁棒值函数逼近的最小绝对策略迭代
机译:一些粘弹性杆传递函数的有理逼近及其在鲁棒控制中的应用。