首页> 中国专利> 利用车道汇总的用于自动驾驶期间的移动对象的车道选择预测的神经网络

利用车道汇总的用于自动驾驶期间的移动对象的车道选择预测的神经网络

摘要

在一个实施方式中,ADV的自动驾驶系统基于从多种传感器获得的传感器数据来感知ADV周围的驾驶环境,包括检测一条或多条车道以及至少一个移动障碍物或移动对象。对于所识别的车道中的每一条,对车道的车道信息应用NN车道特征编码器,以提取一组车道特征。对于给定的移动障碍物,对障碍物的障碍物信息应用NN障碍物特征编码器,以提取一组障碍物特征。此后,对每个车道的车道特征和移动障碍物的障碍物特征应用车道选择预测模型,以预测移动障碍物意欲选择车道中的哪一条。

著录项

  • 公开/公告号CN112241166A

    专利类型发明专利

  • 公开/公告日2021-01-19

    原文格式PDF

  • 申请/专利权人 百度(美国)有限责任公司;

    申请/专利号CN202010095932.4

  • 申请日2020-02-17

  • 分类号G05D1/02(20200101);

  • 代理机构11204 北京英赛嘉华知识产权代理有限责任公司;

  • 代理人马晓亚;王艳春

  • 地址 美国加利福尼亚州

  • 入库时间 2023-06-19 09:36:59

说明书

技术领域

本公开的实施方式总体上涉及操作自动驾驶车辆。更具体地,本公开的实施方式涉及自动驾驶期间的移动障碍物的车道选择预测。

背景技术

以自动驾驶模式运行(例如,无人驾驶)的车辆可以将乘客(尤其是驾驶员)从一些驾驶相关的职责中解放出来。当以自动驾驶模式运行时,车辆可以使用车载传感器导航到各个位置,从而允许车辆在最少人机交互的情况下或在没有任何乘客的一些情况下驾驶。

运动规划与控制是自动驾驶中的关键操作。成功的自动驾驶系统需要能够对周围环境具有良好理解。它应该能够预测周围障碍物的意图和/或未来轨迹,并且据此来规划它自己的移动轨迹。

在预测障碍物的未来移动时,已经利用预测模型来预测障碍物的未来车道选择。然而,这种模型仅侧重于障碍物的运动历史和单条车道,并且对障碍物在未来选择给定车道的概率进行预测。然而,它并没有考虑整个环境。此外,当提取车道特征时,它只关注前向方向上的车道特征,却不关注后向方向上的车道特征。因此,预测可能不准确。

发明内容

本申请的一个方面提供了用于操作自动驾驶车辆(ADV)的计算机实施方法,该方法可包括:基于从自动驾驶车辆的多个传感器获得的传感器数据来感知自动驾驶车辆周围的驾驶环境,包括识别多条车道和移动障碍物;针对所识别的车道中的每一条,对车道应用神经网络车道特征编码器,以提取车道的一组车道特征;对移动障碍物应用神经网络障碍物特征编码器,以提取移动障碍物的一组障碍物特征;以及对所识别的车道的车道特征和移动障碍物的障碍物特征应用车道选择预测模型,以确定移动障碍物将会选择所识别的车道中的哪一条。

本申请的另一方面提供了其中存储有指令的非暂时性机器可读介质,所述指令在由处理器运行时使得所述处理器执行操作。所述操作可包括:基于从自动驾驶车辆的多个传感器获得的传感器数据来感知自动驾驶车辆周围的驾驶环境,包括识别多条车道和移动障碍物;针对所识别的车道中的每一条,对车道应用神经网络车道特征编码器,以提取车道的一组车道特征;对移动障碍物应用神经网络障碍物特征编码器,以提取移动障碍物的一组障碍物特征;以及对所识别的车道的车道特征和移动障碍物的障碍物特征应用车道选择预测模型,以确定移动障碍物将会选择所识别的车道中的哪一条。

本申请的又一方面提供了数据处理系统。该数据处理系统可包括处理器以及存储器,存储器联接至处理器以存储指令,所述指令在由所述处理器运行时使得所述处理器执行操作。所述操作可包括:基于从自动驾驶车辆的多个传感器获得的传感器数据来感知自动驾驶车辆周围的驾驶环境,包括识别多条车道和移动障碍物;针对所识别的车道中的每一条,对车道应用神经网络车道特征编码器,以提取车道的一组车道特征;对移动障碍物应用神经网络障碍物特征编码器,以提取移动障碍物的一组障碍物特征;以及对所识别的车道的车道特征和移动障碍物的障碍物特征应用车道选择预测模型,以确定移动障碍物将会选择所识别的车道中的哪一条。

附图说明

本公开的实施方式以示例而非限制的方式示出在附图的各图中,在附图中类似附图标记指示类似元件。

图1是示出根据一个实施方式的网络化系统的框图。

图2是示出根据一个实施方式的自动驾驶车辆的示例的框图。

图3A至图3B是示出根据一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。

图4A至图4B是根据一个实施方式的车道选择预测系统的图。

图5A至图5C是示出根据一个实施方式的车道选择过程的示例的图。

图6是示出根据一个实施方式的车道选择预测的过程的示例的流程图。

具体实施方式

将参考以下所讨论的细节来描述本公开的各种实施方式和方面,附图将示出所述各种实施方式。下列描述和附图是对本公开的说明,而不应当解释为限制本公开。描述了许多特定细节以提供对本公开各种实施方式的全面理解。然而,在某些情况下,并未描述众所周知的或常规的细节以提供对本公开的实施方式的简洁讨论。

本说明书中对“一个实施方式”或“实施方式”的引述意味着结合该实施方式所描述的特定特征、结构或特性可包括在本公开的至少一个实施方式中。短语“在一个实施方式中”在本说明书中各处的记载不必全部指同一实施方式。

根据一些实施方式,利用神经网络(NN)预测系统来预测障碍物(例如,车辆)的车道选择。该系统不仅使用每个单个车道的特征,而且将所有周围的车道特征汇总在一起。它添加了障碍物运动历史和感兴趣车道的现有提取特征,并且引入了全部周围道路环境的提取特征的另一域。这种新的特征维度可以使预测比传统系统更准确且更智能。

对于给定的障碍物,根据特定的实施方式,输入特征是障碍物本身(具有运动历史的障碍物本身)、前向车道特征(形状、车道点位置)和后向车道特征。存在三个特征编码器,其分别提取三种类型的特征并对它们进行编码。通常,长短期记忆网络(LSTM)或门控循环单元(GRU)可用于编码器。也可以使用时域卷积神经网络(CNN)或多层感知(MLP)。当障碍物特征被编码时,其可以被用作车道编码器的输入,以提供注意力得分,并使车道编码器集中在重要的车道点上。一旦我们具有所有的前向编码和后向编码,它们便可以被传递通过汇总模块,从而形成汇总的编码。另外的编码通常是MLP处理模块。汇总通常是对称函数-最大值池化或均值池化等。最后,我们具有针对每个车道的前向车道编码和后向车道编码,以及针对所有车道相同的障碍物编码和汇总编码。所有特征可以被串接在一起,将其传递通过MLP和Sofmax,以计算每条车道的概率。这是车辆在将来(例如,约3秒)选择相应车道的概率。

根据一个实施方式,ADV的自动驾驶系统基于从多种传感器获得的传感器数据来感知ADV周围的驾驶环境,包括检测一条或多条车道和至少一个移动障碍物或移动对象。对于所识别的车道中的每一条,对所述车道的车道信息应用NN车道特征编码器,以提取一组车道特征。对于给定的移动障碍物,对障碍物的障碍物信息应用NN障碍物特征编码器,以提取一组障碍物特征。此后,对每个车道的车道特征和移动障碍物的障碍物特征应用车道选择预测模型,以预测移动障碍物意欲选择哪条车道。在一个实施方式中,除了单独车道的单独车道特征之外,通过对单独车道特征应用NN环境编码器来将车道特征汇总在一起,以生成一组环境特征(例如,表示所有车道的组合的特征)。然后将车道选择预测模型应用于1)单独的车道特征、2)障碍物特征和3)环境特征。

在一个实施方式中,第一NN车道特征编码器提取第一车道的第一组车道特征,且第二NN车道特征编码器提取第二车道的第二组车道特征。第一组车道特征和第二组车道特征被馈送到车道选择预测模型的第一输入和第二输入。第一NN车道特征编码器和第二NN车道特征编码器可以是相同的NN编码器或不同的NN编码器。车道选择预测模型生成表示移动障碍物可能选择第一车道的概率的第一输出以及表示移动障碍物可能选择第二车道的概率的第二输出。

在一个实施方式中,车道包括相对于移动障碍物的当前位置的至少一个前向车道(例如,在移动障碍物前方的车道)和至少一个后向车道(例如,在移动障碍物后方的车道)。车道选择预测模型生成一个或多个输出,对于所识别的车道中的每一条的输出均表示移动障碍物选择相应车道的概率。将NN车道特征编码器应用于车道的车道中心线的坐标(x,y)。将NN障碍物特征编码器应用于移动障碍物的移动历史的坐标。

图1是示出根据本公开的一个实施方式的自动驾驶车辆网络配置的框图。参考图1,网络配置100包括可以通过网络102通信地联接到一个或多个服务器103至104的自动驾驶车辆101。尽管示出一个自动驾驶车辆,但是多个自动驾驶车辆可以通过网络102联接到彼此和/或联接到服务器103至104。网络102可以是任何类型的网络,例如,有线或无线的局域网(LAN)、诸如互联网的广域网(WAN)、蜂窝网络、卫星网络或其组合。服务器103至104可以是任何类型的服务器或服务器群集,诸如,Web或云服务器、应用服务器、后端服务器或其组合。服务器103至104可以是数据分析服务器、内容服务器、交通信息服务器、地图和兴趣点(MPOI)服务器或者位置服务器等。

自动驾驶车辆是指可以被配置成处于自动驾驶模式中的车辆,在所述自动驾驶模式中,车辆在极少或没有来自驾驶员的输入的情况下导航通过环境。这种自动驾驶车辆可包括传感器系统,所述传感器系统具有配置成检测与车辆运行环境有关的信息的一个或多个传感器。所述车辆和其相关联的控制器使用所检测的信息来导航通过所述环境。自动驾驶车辆101可以在手动模式中、在全自动驾驶模式中或者在部分自动驾驶模式中运行。

在一个实施方式中,自动驾驶车辆101包括但不限于感知与规划系统110、车辆控制系统111、无线通信系统112、用户接口系统113和传感器系统115。自动驾驶车辆101还可包括普通车辆中包括的某些常用部件,诸如:发动机、车轮、方向盘、变速器等,所述部件可以由车辆控制系统111和/或感知与规划系统110使用多种通信信号和/或命令进行控制,该多种通信信号和/或命令例如是加速信号或命令、减速信号或命令、转向信号或命令、制动信号或命令等。

部件110至115可以经由互连件、总线、网络或其组合通信地联接到彼此。例如,部件110至115可以经由控制器局域网(CAN)总线通信地联接到彼此。CAN总线是设计成允许微控制器和装置在没有主机的应用中与彼此通信的车辆总线标准。它是最初是为汽车内的复用电气布线设计的基于消息的协议,但也用于许多其它环境。

现在参考图2,在一个实施方式中,传感器系统115包括但不限于一个或多个相机211、全球定位系统(GPS)单元212、惯性测量单元(IMU)213、雷达单元214以及光探测和测距(LIDAR)单元215。GPS单元212可包括收发器,所述收发器可操作以提供关于自动驾驶车辆的位置的信息。IMU单元213可以基于惯性加速度来感测自动驾驶车辆的位置和定向变化。雷达单元214可以表示利用无线电信号来感测自动驾驶车辆的本地环境内的对象的系统。在一些实施方式中,除感测对象之外,雷达单元214可以另外感测对象的速度和/或前进方向。LIDAR单元215可以使用激光来感测自动驾驶车辆所处环境中的对象。除其它系统部件之外,LIDAR单元215还可包括一个或多个激光源、激光扫描器以及一个或多个检测器。相机211可包括用来收集自动驾驶车辆周围环境的图像的一个或多个装置。相机211可以是静物相机和/或视频相机。相机可以是可机械地移动的,例如,通过将相机安装在旋转和/或倾斜平台上。

传感器系统115还可包括其它传感器,诸如:声纳传感器、红外传感器、转向传感器、油门传感器、制动传感器以及音频传感器(例如,麦克风)。音频传感器可以被配置成从自动驾驶车辆周围的环境中收集声音。转向传感器可以被配置成感测方向盘、车辆的车轮或其组合的转向角度。油门传感器和制动传感器分别感测车辆的油门位置和制动位置。在一些情形下,油门传感器和制动传感器可以集成为集成式油门/制动传感器。

在一个实施方式中,车辆控制系统111包括但不限于转向单元201、油门单元202(也被称为加速单元)和制动单元203。转向单元201用来调整车辆的方向或前进方向。油门单元202用来控制马达或发动机的速度,马达或发动机的速度进而控制车辆的速度和加速度。制动单元203通过提供摩擦使车辆的车轮或轮胎减速而使车辆减速。应注意,如图2所示的部件可以以硬件、软件或其组合实施。

回到图1,无线通信系统112允许自动驾驶车辆101与诸如装置、传感器、其它车辆等的外部系统之间的通信。例如,无线通信系统112可以与一个或多个装置直接无线通信,或者经由通信网络进行无线通信,诸如,通过网络102与服务器103至104通信。无线通信系统112可以使用任何蜂窝通信网络或无线局域网(WLAN),例如,使用WiFi,以与另一部件或系统通信。无线通信系统112可以例如使用红外链路、蓝牙等与装置(例如,乘客的移动装置、显示装置、车辆101内的扬声器)直接通信。用户接口系统113可以是在车辆101内实施的外围装置的部分,包括例如键盘、触摸屏显示装置、麦克风和扬声器等。

自动驾驶车辆101的功能中的一些或全部可以由感知与规划系统110控制或管理,尤其当在自动驾驶模式下操作时。感知与规划系统110包括必要的硬件(例如,处理器、存储器、存储设备)和软件(例如,操作系统、规划和路线安排程序),以从传感器系统115、控制系统111、无线通信系统112和/或用户接口系统113接收信息,处理所接收的信息,规划从起始点到目的地点的路线或路径,随后基于规划和控制信息来驾驶车辆101。替代地,感知与规划系统110可以与车辆控制系统111集成在一起。

例如,作为乘客的用户可以例如经由用户接口来指定行程的起始位置和目的地。感知与规划系统110获得行程相关数据。例如,感知与规划系统110可以从MPOI服务器中获得位置和路线信息,所述MPOI服务器可以是服务器103至104的一部分。位置服务器提供位置服务,并且MPOI服务器提供地图服务和某些位置的POI。替代地,此类位置和MPOI信息可以本地高速缓存在感知与规划系统110的永久性存储装置中。

当自动驾驶车辆101沿着路线移动时,感知与规划系统110还可以从交通信息系统或服务器(TIS)获得实时交通信息。应注意,服务器103至104可以由第三方实体进行操作。替代地,服务器103至104的功能可以与感知与规划系统110集成在一起。基于实时交通信息、MPOI信息和位置信息以及由传感器系统115检测或感测的实时本地环境数据(例如,障碍物、对象、附近车辆),感知与规划系统110可以规划最佳路线并且根据所规划的路线例如经由控制系统111来驾驶车辆101,以安全且高效到达指定目的地。

服务器103可以是为多种客户端执行数据分析服务的数据分析系统。在一个实施方式中,服务器103包括数据收集器121和机器学习引擎122。数据收集器121从各种车辆(自动驾驶车辆或由人类驾驶员所驾驶的常规车辆)收集驾驶统计数据123。驾驶统计数据123包括表明在不同的时间点时发出的驾驶命令(例如,油门命令、制动命令、转向命令)以及车辆的传感器所捕获的车辆的响应(例如速度、加速、减速、方向)的信息。驾驶统计数据123还可包括描述不同的时间点处的驾驶环境的信息,诸如,例如路线(包括起始位置和目的地位置)、MPOI、道路状况、天气状况等。

基于驾驶统计数据123,机器学习引擎122出于多种目的而生成或训练一组规则、算法和/或预测模型124。在一个实施方式中,算法124可以包括用于障碍物的车道选择预测的车道特征编码器、障碍物特征编码器和环境特征编码器。然后,可以将算法124上传到ADV上,以在自动驾驶过程期间实时地利用。

图3A和图3B是示出根据一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。系统300可以被实施为图1的自动驾驶车辆101的一部分,包括但不限于感知与规划系统110、控制系统111和传感器系统115。参考图3A至图3B,感知与规划系统110包括但不限于定位模块301、感知模块302、预测模块303、决策模块304、规划模块305、控制模块306、路线安排模块307和车道选择预测模块308。

模块301至308中的一些或全部可以以软件、硬件或其组合实施。例如,这些模块可以安装在永久性存储装置352中、加载到存储器351中,并且由一个或多个处理器(未示出)执行。应注意,这些模块中的一些或全部可以通信地联接到图2的车辆控制系统111的一些或全部模块或者与它们集成在一起。模块301至308中的一些可以一起集成为集成模块。

定位模块301(例如,利用GPS单元212)确定自动驾驶车辆300的当前位置,并管理与用户的行程或路线相关的任何数据。定位模块301(也被称为地图与路线模块)管理与用户的行程或路线相关的任何数据。用户可以例如经由用户接口登录并且指定行程的起始位置和目的地。定位模块301与自动驾驶车辆300的诸如地图和路线信息311的其它部件通信,以获得行程相关数据。例如,定位模块301可以从位置服务器和地图与POI(MPOI)服务器获得位置和路线信息。位置服务器提供位置服务,并且MPOI服务器提供地图服务和某些位置的POI,这些服务和POI可以作为地图和路线信息311的一部分高速缓存。当自动驾驶车辆300沿着路线移动时,定位模块301也可以从交通信息系统或服务器获得实时交通信息。

基于由传感器系统115提供的传感器数据和由定位模块301获得的定位信息,感知模块302确定对周围环境的感知。感知信息可以表示普通驾驶员在驾驶员正驾驶的车辆周围将感知到的东西。感知可包括例如对象形式的车道配置、交通灯信号、另一车辆的相对位置、行人、建筑物、人行横道或其它交通相关标志(例如,停止标志、让行标志)等。车道配置包括描述一条车道或多条车道的信息,例如,车道的形状(例如,直线或弯曲)、车道的宽度、道路中的车道数目、单向车道或双向车道、合流车道或分流车道、出口车道等。

感知模块302可包括计算机视觉系统或计算机视觉系统的功能,以处理并分析由一个或多个相机捕获的图像,从而识别自动驾驶车辆环境中的对象和/或特征。所述对象可包括交通信号、道路边界、其它车辆、行人和/或障碍物等。计算机视觉系统可以使用对象识别算法、视频追踪以及其它计算机视觉技术。在一些实施方式中,计算机视觉系统可以绘制环境地图,追踪对象,以及估算对象的速度等。感知模块302也可以基于由诸如雷达和/或LIDAR的其它传感器提供的其它传感器数据来检测对象。

针对每个对象,预测模块303预测所述对象在所述情况下的行为。基于在某时间点感知驾驶环境的感知数据根据地图/路线信息311与交通规则312的集合来执行所述预测。例如,如果对象是相反方向处的车辆且当前驾驶环境包括十字路口,则预测模块303将预测该车辆是可能向前直行还是可能转弯。如果感知数据表明十字路口没有交通灯,则预测模块303可预测该车辆可能在进入十字路口之前必须完全停下。如果感知数据表明该车辆当前处于左转专用车道或右转专用车道,则预测模块303可分别预测该车辆更可能进行左转或右转。

针对每个对象,决策模块304作出关于如何处置对象的决定。例如,针对特定对象(例如,交叉路线中的另一车辆)以及描述对象的元数据(例如,速度、方向、转弯角度),决策模块304决定如何与所述对象相遇(例如,超车、让行、停止、经过)。决策模块304可以根据诸如交通规则或驾驶规则312的规则集来作出此类决定,所述规则集可以存储在永久性存储装置352中。

路线安排模块307配置成提供从起始点到终点的一个或多个路线或路径。对于例如从用户处接收到的从起始位置到目的地位置的给定行程,路线安排模块307获取地图和路线信息311,并确定从起始位置到达目的地位置的所有可能的路线或路径。对于确定了从起始位置到达目的地位置的路线中的每一个,路线安排模块307可以以地形图的形式生成参考线路。参考线路表示没有诸如其它车辆、障碍物或交通状况的任何干扰的理想路线或理想路径。即,如果道路上没有其它车辆、行人或障碍物,则ADV应精确地或接近地遵循参考线路。随后可向决策模块304和/或规划模块305提供地形图。根据由其它模块提供的其它数据(诸如,来自定位模块301的交通状况、感知模块302感知的驾驶环境和预测模块303预测的交通状况),决策模块304和/或规划模块305检验所有可能的路线,以选择并修正最佳路线中的一条。取决于在某时间点时的特定的驾驶环境,用于控制ADV的实际路径或路线可接近于或不同于由路线安排模块307提供的参考线路。

基于针对所感知到的对象中的每个的决定,规划模块305使用路线安排模块307提供的参考线路作为基础,为自动驾驶车辆规划路径或路线以及驾驶参数(例如,距离、速度和/或转弯角度)。即,针对给定的对象,决策模块304决定对对象做什么,而规划模块305确定如何去做。例如,针对给定的对象,决策模块304可以决定经过所述对象,而规划模块305可以确定在所述对象的左侧还是右侧经过。规划和控制数据由规划模块305生成,包括描述车辆300在下一移动周期(例如,下一路线/路径段)中将如何移动的信息。例如,规划和控制数据可以指示车辆300以30英里每小时(mph)的速度移动10米,随后以25mph的速度变到右侧车道。

基于规划和控制数据,控制模块306根据由规划和控制数据限定的路线或路径通过将适当的命令或信号发送到车辆控制系统111来控制并驾驶自动驾驶车辆。所述规划和控制数据包括足够的信息,以沿着路径或路线在不同的时间点使用适当的车辆设置或驾驶参数(例如,油门、制动和转向命令)将车辆从路线或路径的第一点驾驶到第二点。

在一个实施方式中,规划阶段在多个规划周期(也称为驾驶周期)中执行,诸如,以例如每100毫秒(ms)的时间间隔执行。针对每个规划周期或驾驶周期,将基于规划和控制数据发出一个或多个控制命令。即,对于每个100ms,规划模块305规划下一路线段或路径段,例如,包括目标位置和ADV到达该目标位置所需的时间。替代地,规划模块305还可指定具体速度、方向和/或转向角度等。在一个实施方式中,规划模块305为下一预定的时间段(诸如5秒)规划路线段或路径段。对于每个规划周期,规划模块305基于先前周期中所规划的目标位置为当前周期(例如,下个5秒)规划目标位置。控制模块306随后基于当前周期的规划和控制数据生成一个或多个控制命令(例如,油门控制命令、制动控制命令、转向控制命令)。

应注意,决策模块304和规划模块305可以集成为集成模块。决策模块304/规划模块305可包括导航系统或导航系统的功能,以确定自动驾驶车辆的驾驶路径。例如,导航系统可以确定用于实现自动驾驶车辆沿着以下路径移动的一系列速度和前进方向:所述路径在使自动驾驶车辆沿着通往最终目的地的基于车行道的路径前进的同时,基本上避免感知到的障碍物。目的地可以根据经由用户接口系统113进行的用户输入来设定。导航系统可以在自动驾驶车辆正在运行的同时动态地更新驾驶路径。导航系统可以将来自GPS系统和一个或多个地图的数据合并,以确定用于自动驾驶车辆的驾驶路径。

诸如感知结果、预测结果、规划结果、控制结果的操作数据可以由数据记录模块(未示出)记录,并作为驾驶统计数据313的一部分存储在永久性存储装置352中。驾驶统计数据313可以包括不同时间点的对移动障碍物的预测和障碍物的实际移动、所规划的轨迹、发出的控制命令以及车辆的响应。驾驶统计数据313可用于车辆的后续感知、预测和规划。可替代地,出于训练的目的,可以离线分析驾驶统计数据313,以改善预测模型或驾驶算法。

根据一个实施方式,车道选择预测模块308配置成使用一个或多个NN特征编码器和/或预测模型314,基于相应的车道特征、移动障碍物的障碍物特征和环境特征来预测移动障碍物将可能选择哪条车道。因此,考虑整个驾驶环境而非仅考虑个别的车道特征来做出预测。车道特征包括相对于移动障碍物的位置的前向车道和后向车道的特征。对移动障碍物的车道选择的预测可以更加准确。

图4A是示出根据一个实施方式的车道选择预测模块的示例的框图。参照图4A,在一个实施方式中,车道选择预测模块308包括一个或多个车道特征编码器401、障碍物特征编码器402、环境特征编码器403和车道选择预测器404。

现在参照图4B,图4B示出了由图4A的车道选择预测模块308执行的车道选择预测过程。在该示例中,对于车道411A至411B(统称为车道411)中的每个,利用车道特征编码器(例如,车道特征编码器401A至401B,统称为车道特征编码器401)来提取并编码相应车道的各个车道特征。车道特征编码器411A至411B中的每个可以是相同车道特征编码器401的特定示例,或者可选地,车道特征编码器411A至411B可以是不同类型的特征编码器。此外,对于移动障碍物(在该示例中,移动障碍物412)中的每个,利用障碍物特征编码器402提取和编码一组障碍物特征。从车道特征编码器401和障碍物特征编码器402生成的车道特征和障碍物特征被馈送到车道选择预测器404中。在一个实施方式中,基于车道特征和障碍物特征,车道选择预测器404针对车道411A至411B中的每个以移动障碍物412可能选择并移动进入其中的概率的形式生成车道预测。

根据一个实施方式,利用环境特征编码器403将由车道特征编码器401A至401B提取的车道特征汇总,以生成一组环境特征。环境特征也被馈送到车道选择预测器404中。即,车道选择预测器404配置成基于由车道特征编码器401A至401B提供的相应车道特征、由障碍物特征编码器402提供的障碍物特征以及由环境特征编码器403提供的环境特征或汇总的车道特征来预测障碍物412的车道选择。

图5A至图5C示出了可以与本发明的实施方式一起使用的驾驶环境的示例。参照图5A,在该示例中,存在由车道中心线501至504表示的四条车道。移动障碍物505(例如,车辆)在车道503上移动,但是它可以停留在当前的车道503中,或者转入到车道501、502和504中的任意一条车道。根据一个实施方式,车道中心线501至504的坐标被馈送到相应的车道特征编码器401A至401D的输入中,其中,相应的车道特征编码器401A至401D分别生成相应的几组车道特征511至514。此外,障碍物编码器402被应用于障碍物505的移动历史(例如,由小圆圈表示的先前位置的坐标),其中,障碍物编码器402生成一组障碍物特征515。

现在参照图5B,车道特征511至514被馈送到环境特征编码器403中。在一个实施方式中,环境特征编码器403是包括MLP(多层感知)层和全局平均池化层的神经网络。MLP是一类前馈人工神经网络。MLP包括至少三层的节点:输入层、隐藏层和输出层。除了输入节点之外,每个节点均是使用非线性激活函数的神经元。MLP利用被称为反向传播的监督学习技术进行训练。它的多个层和非线性激活函数将MLP与线性感知器区分开。它可以区分不可线性分离的数据。全局平均池化是计算先前层中的每个特征映射的平均输出的运算。环境特征编码器403基于车道特征511至514生成一组环境特征520。环境特征也被称为汇总的车道特征。

如图5C所示,车道特征、障碍物特征和环境特征中的全部都被馈送到车道选择预测器404中。在如图5C所示的这个示例中,使用softmax函数作为车道选择预测器404的示例。Softmax是取K个实数的向量作为输入并将其归一化成由K个概率组成的概率分布的函数。即,在应用sofmax之前,一些矢量分量可以是负的,或者可以大于1;并且其总和可能不是1;但是在应用softmax函数之后,每个分量将处于区间(0,1)中,并且这些分量的总和将等于1,使其能够被解释为概率。在神经网络中经常使用Softmax来将网络的非归一化输出映射到预测输出类别上的概率分布。

根据一个实施方式,车道可以基于障碍物的位置而被分割成前向车道部分和后向车道部分。在障碍物前方的车道部分被称为前向车道,而在障碍物后方的车道部分被称为后向车道。为了对车道选择进行预测,可以将前向车道和后向车道视为单独的车道。使用单独的车道特征编码器来对前向车道的车道特征和后向车道的车道特征进行编码,即使前向车道和后向车道在物理上是相同的车道。因此,预测考虑了在障碍物后面的车道特征。

图6是示出根据一个实施方式的车道选择预测的过程的示例的流程图。过程600可以由可包括软件、硬件或其组合的处理逻辑来执行。例如,可以由车道选择预测模块308执行过程600。参照图6,在框601处,处理逻辑基于从ADV的多种传感器获得的传感器数据来感知ADV周围的驾驶环境,包括识别或检测一条或多条车道和移动障碍物。在框602处,针对车道中的每一条,利用车道特征编码器来提取该车道的一组车道特征。在框603处,利用障碍物特征编码器来提取移动障碍物的一组障碍物特征。在框604处,利用环境特征编码器基于从车道特征编码器提取的车道的车道特征来提取一组环境特征。在框605处,基于车道特征、障碍物特征和环境特征,利用车道选择预测模型来预测移动障碍物的车道选择。

应注意,如上文示出和描述的部件中的一些或全部可以以软件、硬件或其组合实施。例如,此类部件可以实施为安装并存储在永久性存储装置中的软件,所述软件可以加载在存储器中并通过处理器(未示出)执行以实施本申请全文中所述的过程或操作。可替代地,此类部件可以实施为编程或嵌入到专用硬件(诸如,集成电路(例如,专用集成电路或ASIC)、数字信号处理器(DSP)或现场可编程门阵列(FPGA))中的可执行代码,所述可执行代码可以经由来自应用的相应驱动程序和/或操作系统来访问。此外,此类部件可以实施为处理器或处理器内核中的特定硬件逻辑,作为可由软件部件通过一个或多个特定指令访问的指令集的一部分。

前述详细描述中的一些部分已经根据在计算机存储器内对数据位的运算的算法和符号表示而呈现。这些算法描述和表示是数据处理领域中的技术人员所使用的方式,以将他们的工作实质最有效地传达给本领域中的其他技术人员。本文中,算法通常被认为是导致所期望结果的自洽操作序列。这些操作是指需要对物理量进行物理操控的操作。

然而,应当牢记,所有这些和类似的术语均旨在与适当的物理量关联,并且仅仅是应用于这些量的方便标记。除非在以上讨论中以其它方式明确地指出,否则应当了解,在整个说明书中,利用术语(诸如所附权利要求书中所阐述的术语)进行的讨论是指计算机系统或类似电子计算装置的动作和处理,所述计算机系统或电子计算装置操控计算机系统的寄存器和存储器内的表示为物理(电子)量的数据,并将所述数据变换成计算机系统存储器或寄存器或者其它此类信息存储设备、传输或显示装置内类似地表示为物理量的其它数据。

本公开的实施方式还涉及用于执行本文中的操作的设备。这种计算机程序被存储在非暂时性计算机可读介质中。机器可读介质包括用于以机器(例如,计算机)可读的形式存储信息的任何机构。例如,机器可读(例如,计算机可读)介质包括机器(例如,计算机)可读存储介质(例如,只读存储器(“ROM”)、随机存取存储器(“RAM”)、磁盘存储介质、光存储介质、闪存存储器装置)。

前述附图中所描绘的过程或方法可以由处理逻辑来执行,所述处理逻辑包括硬件(例如,电路、专用逻辑等)、软件(例如,实现在非暂时性计算机可读介质上)或两者的组合。尽管所述过程或方法在上文是依据一些顺序操作来描述的,但是应当了解,所述操作中的一些可以按不同的顺序执行。此外,一些操作可以并行地执行而不是顺序地执行。

本公开的实施方式并未参考任何特定的编程语言进行描述。应认识到,可以使用多种编程语言来实施如本文描述的本公开的实施方式的教导。

在以上的说明书中,已经参考本公开的具体示例性实施方式对本公开的实施方式进行了描述。将显而易见的是,在不脱离所附权利要求书中阐述的本发明的更宽泛精神和范围的情况下,可以对本公开作出各种修改。因此,应当在说明性意义而不是限制性意义上来理解本说明书和附图。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号