退出
我的积分:
中文文献批量获取
外文文献批量获取
周浦城; 洪炳殚; 黄庆成;
哈尔滨工业大学计算机科学与技术学院,黑龙江,哈尔滨,150001;
多agent学习; Q-学习; 利益分配学习; 模块化结构; 对手建模;
机译:使用其他Agent内部模型的估计的多Agent强化学习方法
机译:一种新颖的机器学习方法,用于评估公共政策:一种与大学研究人员的绩效有关的应用
机译:动态目标跟踪的一种新颖的无模型Actor-Critic强化学习方法
机译:一种强化学习方法,用于了解大鼠的追逐行为。
机译:莱姆病疫苗的设计作为一种新颖的跨学科研究生课程中的一种主动学习方法
机译:一种基于策略和融合的混合多agent强化学习方法
机译:拥挤交叉口网络中基于agent的交通管理与强化学习。总结报告。
机译:综合多经验模型的经验强化型强化学习方法与环境识别型强化学习方法的分布式强化学习方法
机译:经验强化型强化学习系统,经验强化型强化学习方法和经验强化型强化学习计划
机译:逆向强化学习方法,用于向逆向强化学习过程执行指令存储指令的存储介质,逆向强化学习系统以及包含逆向强化学习系统的预测系统
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。