退出
我的积分:
中文文献批量获取
外文文献批量获取
公开/公告号CN110535146A
专利类型发明专利
公开/公告日2019-12-03
原文格式PDF
申请/专利权人 哈尔滨工业大学;中国电力科学研究院有限公司;
申请/专利号CN201910793475.3
发明设计人 张伟;杨丰毓;钱敏慧;陈宁;赵大伟;
申请日2019-08-27
分类号
代理机构哈尔滨市哈科专利事务所有限责任公司;
代理人吴振刚
地址 150001 黑龙江省哈尔滨市南岗区西大直街92号
入库时间 2024-02-19 16:40:09
法律状态公告日
法律状态信息
法律状态
2019-12-27
实质审查的生效 IPC(主分类):H02J3/18 申请日:20190827
实质审查的生效
2019-12-03
公开
机译: 基于时空注意的深度强化学习,用于控制自主车辆的分层车道变化策略
机译: 基于深度强化学习的停车策略
机译: 通过基于CAD的深度逆强化学习自动生成机器人控制策略的方法和系统
机译:使用深度策略梯度和基于价值函数的强化学习进行交通灯控制
机译:基于策略梯度的独立于任务的高效强化学习方法(基于策略梯度的独立于任务的高效Ihi学习方法)
机译:基于深度分布强化学习的高级驾驶策略确定
机译:使用深度确定性策略梯度的深度强化学习对固定翼飞机的自动着陆控制
机译:不确定系统的最优跟踪控制:基于策略和基于策略的强化学习方法
机译:更正:在连续状态和动作空间中基于峰值的强化学习:当策略梯度方法失败时
机译:使用深度策略 - 梯度和价值函数的交通灯控制 基于强化学习
机译:基于多目标强化学习的认知空间通信深度神经网络。