机译:通过生成模型生产的样本提高深度增强学习的探索效率
Soochow Univ Sch Comp Sci & Technol Suzhou 215006 Jiangsu Peoples R China;
Soochow Univ Sch Comp Sci & Technol Suzhou 215006 Jiangsu Peoples R China;
Soochow Univ Sch Comp Sci & Technol Suzhou 215006 Jiangsu Peoples R China;
Soochow Univ Sch Comp Sci & Technol Suzhou 215006 Jiangsu Peoples R China;
Deep reinforcement learning; Exploration; Generative adversarial network; Sample efficiency; Convergence;
机译:使用生成环境建模提高深度加固学习中的采样效率
机译:经验丰富的深度加强学习,具有生成的对抗网络(GANS),用于无模型超可靠的低延迟通信
机译:Minimax PAC使用生成模型限制了强化学习的样本复杂度
机译:论生成模型加固学习的样本复杂性
机译:提高模仿和钢筋学习的样本效率
机译:探索策略通过深度强化学习来改善从头配体的多样性:腺苷A2A受体的情况
机译:使用生成环境建模提高深度加强学习中的采样效率