退出
我的积分:
中文文献批量获取
外文文献批量获取
张煜;
浙江大学;
强化学习; 函数逼近; 统一;
机译:基于聚类的图拉普拉斯框架,用于强化学习中的价值函数逼近
机译:基于选择性脱敏神经网络的强化学习的价值函数逼近
机译:通过使用连续动作的基于接受域的函数逼近方法,通过强化学习来学习达到
机译:梯度Q(σ,λ):强化学习中具有函数逼近的统一算法
机译:强化学习的稀疏值函数逼近。
机译:通过使用连续动作的基于受体场的函数逼近方法通过强化学习来学习达到
机译:通过使用连续动作的基于受体场的函数逼近方法,通过强化学习来学习达到
机译:拥挤交叉口网络中基于agent的交通管理与强化学习。总结报告。
机译:基于深度强化学习的多步问题回答系统
机译:具有独立的亏损切断功能的开放式利率管理系统,以统一的利率执行基于库存信用交易的客户帐户中所有开放式利率的统一基于利率的指定利率,以独立的,基于股票的价格独立设计的具有亏损利率功能的股票管理系统统一地处理客户帐户中的所有仓位,并以独立的基于未平仓利率的指定存款保持率独立执行具有亏损剪切功能的未平仓利率管理系统,以统一执行存量交易中客户帐户的未清利率
机译:AP基于神经网络的基于强化学习的聚类方法和基于神经网络的协作通信基于强化学习的聚类方法
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。