首页> 外文会议> >Temporal-Difference learning an online support vector regression approach
【24h】

Temporal-Difference learning an online support vector regression approach

机译:时差学习在线支持向量回归方法

获取原文

摘要

This paper proposes a new algorithm for Temporal-Difference (TD) learning using online support vector regression. It benefits from the good generalization properties support vector regression (SVR) has, and also can do incremental learning and automatically track variation of environment with time-varying characteristics. Using the online SVR we can obtain good estimation of value function in TD learning in linear and nonlinear prediction problems. Experimental results demonstrate the effectiveness of the proposed method by comparison with others methods.
机译:本文提出了一种使用在线支持向量回归的时差学习算法。它得益于支持向量回归(SVR)的良好泛化特性,并且还可以进行增量学习并自动跟踪具有时变特征的环境变化。使用在线SVR,我们可以在线性和非线性预测问题中的TD学习中获得良好的价值函数估计。实验结果通过与其他方法的比较证明了该方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号