首页> 中文会议>2018中国大数据技术大会(BDTC） >深度多智能体强化学习

深度多智能体强化学习

页面导航

摘要
著录项
相似文献
相关主题

摘要

Types of RL algorithms:Value Based,Learnt Value Function,Implicit policy(e.g.∈一greedy);Policy Based,No Value Function,Learnt Policy;Actor-Critic,Learnt Value Function,Learnt Policy.Other(multiagent)RL application scenarios:Auto-driving scenarios,Software Testing(e.g.,Fuzzing,code summarization),Data Mining(Feature Engineering),Cyber-Physical Systems(security check),NLP(image to caption,dialogue generation),Multi-robotic systems,Mililitary Scenarios.

著录项

来源
《2018中国大数据技术大会(BDTC）》|2018年|1-51|共51页
会议地点北京
作者
郝建业;
展开▼
作者单位

中国计算机学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类自动推理、机器学习;
关键词
强化学习; 深度学习; 多智能体;
入库时间 2022-08-17 11:33:28

相似文献

中文文献
外文文献
专利

1. 基于值分布的多智能体分布式深度强化学习算法 [J] . 陈妙云 ,王雷 ,盛捷 . 计算机系统应用 . 2022,第1期
2. 基于分区缓存区重放与多线程交互的多智能体深度强化学习算法 [J] . 柴来 ,张婷婷 ,董会 . 计算机学报 . 2021,第006期
3. 基于多智能体深度强化学习的空战博弈对抗策略训练模型 [J] . 孙彧 ,李清伟 ,徐志雄 . 指挥信息系统与技术 . 2021,第002期
4. 基于SAC的多智能体深度强化学习算法 [J] . 肖硕 ,黄珍珍 ,张国鹏 . 电子学报 . 2021,第009期
5. 基于多智能体深度强化学习的空战博弈对抗策略训练模型 [J] . 孙彧 ,李清伟 ,徐志雄 . 指挥信息系统与技术 . 2021,第002期
6. 基于强化学习的智能体避障研究 [C] . YING Xiao-kun ,应小昆 ,PANG Yi . 第九届中国多智能体系统与控制会议（MASC2013） . 2014
7. 基于深度强化学习的多智能体路径规划研究 [A] . 刘岱远 . 2021

深度多智能体强化学习

摘要

著录项

相似文献

相关主题

期刊订阅