...
机译:使用强化学习与外部奖励进行开放式自然语言生成
Univ N Carolina Dept Comp Sci Charlotte NC 28223 USA;
Univ N Carolina Dept Comp Sci Charlotte NC 28223 USA;
Univ N Carolina Dept Comp Sci Charlotte NC 28223 USA;
Deep learning; Reinforcement learning; Emotional intelligence; Human feedback; Seq2seq learning; Conversational agent; Natural language generation;
机译:分层强化学习以生成自然语言
机译:将固定模式状态引入带有惩罚和奖励的在线强化学习中,并将其应用于两足机器人腰部弹道
机译:在使用业务流程,自然语言处理和Web服务的生成电子学习资源
机译:使用自然语言实现强化学习中的语言行动奖励网络
机译:自然语言场景中的深度强化学习
机译:推断精神分裂症患者的奖励预测错误:强化学习的动态奖励任务
机译:开放式域表的逻辑自然语言生成