退出
我的积分:
中文文献批量获取
外文文献批量获取
吴元斌;
重庆三峡学院数学与计算机科学学院 重庆404000;
MDP; 自适应动态规划; 时序差分学习; Q-学习;
机译:使用其他Agent内部模型的估计的多Agent强化学习方法
机译:基于策略梯度的独立于任务的高效强化学习方法(基于策略梯度的独立于任务的高效Ihi学习方法)
机译:具有精确定位的高维机械臂逆运动学的Multiagent强化学习方法
机译:预测控制设计的强化学习方法:自动驾驶汽车应用
机译:钙通道阻滞剂对非糖尿病原发性高血压患者糖耐量炎症状态和循环祖细胞的影响:阿泽地平和氨氯地平对葡萄糖耐量和内皮功能的比较研究-一项交叉试验(AGENT)
机译:一种基于策略和融合的混合多agent强化学习方法
机译:拥挤交叉口网络中基于agent的交通管理与强化学习。总结报告。
机译:综合多经验模型的经验强化型强化学习方法与环境识别型强化学习方法的分布式强化学习方法
机译:经验强化型强化学习系统,经验强化型强化学习方法和经验强化型强化学习计划
机译:逆向强化学习方法,用于向逆向强化学习过程执行指令存储指令的存储介质,逆向强化学习系统以及包含逆向强化学习系统的预测系统
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。