首页> 中国专利> 用于控制自主车辆的分层车道变换策略的基于空间和时间注意力的深度强化学习

用于控制自主车辆的分层车道变换策略的基于空间和时间注意力的深度强化学习

页面导航

摘要
著录项
法律信息
相似文献

摘要

提供了采用基于空间和时间注意力的分层车道变换策略的深度强化学习来控制自主车辆的系统和方法。执行器‑评价网络架构包括：执行器网络，其处理从环境接收的图像数据以将车道变换策略作为分层动作的集合来学习；以及评价网络，其评估车道变换策略以计算损失和梯度来预测动作值函数(Q)，其用于驱动学习车道变换策略以及更新其参数。执行器‑评价网络架构实施空间注意力模块以选择图像数据中重要的相关区域，以及时间注意力模块以学习要应用于过去的图像数据帧的时间注意力权重，从而指示在决定选择哪个车道变换策略时的相对重要性。

著录项

公开/公告号CN111137292A

专利类型发明专利
公开/公告日2020-05-12

原文格式PDF
申请/专利权人通用汽车环球科技运作有限责任公司;卡内基梅隆大学;
展开▼

申请/专利号CN201910496094.9
发明设计人 P·帕拉尼萨梅;U·P·穆达里格;陈亦伦;J·M·多兰;K·米林;
展开▼

申请日2019-06-10
分类号
代理机构中国专利代理(香港)有限公司;
代理人刘桢
地址美国密歇根州
入库时间 2023-12-17 08:13:05

法律信息

法律状态公告日

法律状态信息

法律状态
2020-06-05

实质审查的生效 IPC(主分类):B60W30/18 申请日:20190610

实质审查的生效
2020-05-12

公开

公开

相似文献

专利
中文文献
外文文献

1. 用于控制自主车辆的分层车道变换策略的基于空间和时间注意力的深度强化学习 [P] . 中国专利： CN111137292A . 2020-05-12
2. 用于自主车辆的基于弹簧系统的变换车道方法 [P] . 中国专利： CN107985313A . 2018-05-04
3. SPATIAL AND TEMPORAL ATTENTION-BASED DEEP REINFORCEMENT LEARNING OF HIERARCHICAL LANE-CHANGE POLICIES FOR CONTROLLING AN AUTONOMOUS VEHICLE [P] . 美国专利： US2020139973A1 . 2020-05-07

机译：基于时空注意的深度强化学习，用于控制自主车辆的分层车道变化策略
4. Spatial and temporal attention-based deep reinforcement learning of hierarchical lane-change policies for controlling an autonomous vehicle [P] . US10940863B2 . 2021-03-09

机译：基于空间和时间关注的分层车道改变政策的深度增强学习，用于控制自主车辆
5. SPATIAL AND TIMELINE ATTENTION-BASED DEPTH LEARNING LEARNING OF HIERARCHICAL Lane-changing Strategies for Controlling an Autonomous Vehicle [P] . 德国专利： DE102019115707A1 . 2020-05-07

机译：基于空间和时间线注意的深度学习，用于控制自动驾驶汽车的分层换道策略