首页> 外文会议>Insternational Joint Conference on Natural Language Processing >Fast Reinforcement Learning of Dialogue Policies using Stable Function Approximation
【24h】

Fast Reinforcement Learning of Dialogue Policies using Stable Function Approximation

机译:使用稳定函数近似进行对话政策的快速加固学习

获取原文

摘要

We propose a method to speed up reinforcement learning of policies for spoken dialogue systems. This is achieved by learning the value of applying actions in selected states only. The value of unsampled states is approximated by a linear interpolation of known states. Experiments show that the improved algorithm speeds up the learning of dialogue policies.
机译:我们提出了一种加快加强对话系统政策的加强策略的方法。 这是通过学习仅在所选状态中应用操作的价值来实现的。 未拼接状态的值由已知状态的线性插值近似。 实验表明,改进的算法加快了对话政策的学习。

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号