退出
我的积分:
中文文献批量获取
外文文献批量获取
公开/公告号CN111582441A
专利类型发明专利
公开/公告日2020-08-25
原文格式PDF
申请/专利权人 清华大学;
申请/专利号CN202010298982.2
发明设计人 杨君;薛晨;芦维宁;梁斌;赵千川;
申请日2020-04-16
分类号G06N3/04(20060101);G06N3/08(20060101);
代理机构11201 北京清亦华知识产权代理事务所(普通合伙);
代理人王艳斌
地址 100084 北京市海淀区清华园
入库时间 2023-12-17 11:49:32
法律状态公告日
法律状态信息
法律状态
2020-08-25
公开
机译: 强化学习方法,强化学习设备和强化学习程序,可实现高效学习
机译: 通过迭代混合强化学习方法进行人工神经网络压缩
机译:基于策略梯度的独立于任务的高效强化学习方法(基于策略梯度的独立于任务的高效Ihi学习方法)
机译:模拟电力贸易中基于策略梯度和价值函数的强化学习方法比较
机译:基于动作历史的动态强化功能的利润共享强化学习方法
机译:基于估计状态值函数的离散线性二次调节问题的策略梯度强化学习方法
机译:强化学习的稀疏值函数逼近。
机译:强化学习为迭代囚徒困境带来了主导策略
机译:发电投资的不确定性:强化学习方法