首页> 中国专利> 用于自动驾驶的基于当前帧的对象检测自动标记先前帧中的对象的方法

用于自动驾驶的基于当前帧的对象检测自动标记先前帧中的对象的方法

页面导航

摘要
著录项
说明书
相似文献

摘要

接收图像的列表。在ADV行驶通过驾驶环境的同时，由ADV的传感器按时间顺序捕获图像。识别图像中的、包括具有第一尺寸(例如，较大尺寸)的第一对象的第一图像，所述第一对象由对象检测器使用对象检测算法检测。响应于第一对象的检测，基于由图像的列表表示的ADV的移动轨迹，从第一图像开始按时间往回遍历列表中的图像，以识别包括具有第二尺寸(例如，较小尺寸)的第二对象的第二图像。然后，标记第二图像中的、与第一图像中的第一对象对应的第二对象。具有经标记的第二图像的图像的列表可以在自动驾驶期间被用于后续的对象检测。

著录项

公开/公告号CN112183175A

专利类型发明专利
公开/公告日2021-01-05

原文格式PDF
申请/专利权人百度(美国)有限责任公司;
展开▼

申请/专利号CN202010095897.6
发明设计人崔泰恩;陈光;张伟德;郭玉亮;蔡家伟;
展开▼

申请日2020-02-17
分类号G06K9/00(20060101);
代理机构11204 北京英赛嘉华知识产权代理有限责任公司;
代理人马晓亚;王艳春
地址美国加利福尼亚州
入库时间 2023-06-19 09:26:02

说明书

技术领域

本公开的实施方式总体上涉及操作自动驾驶车辆。更具体地，本公开的实施方式涉及基于当前帧的对象检测来自动标记先前帧的对象。

背景技术

以自动驾驶模式(例如，无人驾驶)运行的车辆可以将乘客(尤其是驾驶员)从一些驾驶相关的职责中解放出来。当以自动驾驶模式运行时，车辆可以使用车载传感器导航到各个位置，从而允许车辆在最少人机交互的情况下或在没有任何乘客的一些情况下行进。

感知是自动驾驶中的关键操作。为了有效且精确地自动驾驶车辆，自动驾驶系统必须基于训练数据集(诸如，具有已知的带标注的对象的图像)进行训练。通常，这种标注需要繁琐的手动处理。缺少用于对用于训练自动驾驶系统的对象进行标记的有效方式。

发明内容

本申请的一个方面提供了用于自动驾驶的标记对象的计算机实施方法，该方法可包括：接收按时间顺序捕获的图像的列表，其中，图像中的每个在自动驾驶车辆行驶通过驾驶环境时由安装在自动驾驶车辆上的传感器捕获；识别图像中的第一图像，第一图像包括具有第一尺寸的第一对象，第一对象由对象检测器使用对象检测算法基于第一图像检测和识别；以及响应于所识别的第一对象，基于由图像的列表表示的自动驾驶车辆的移动轨迹，按时间往回遍历列表中的图像，以识别包括具有第二尺寸的第二对象的第二图像，以及标记第二图像中的、与第一图像中的第一对象对应的第二对象，其中，具有经标记的第二图像的图像的列表在自动驾驶期间被用于后续的对象检测。

本申请的另一方面提供了存储有指令的非暂时性机器可读介质，所述指令在由处理器运行时使得所述处理器执行操作。所述操作可包括：接收按时间顺序捕获的图像的列表，其中，图像中的每个在自动驾驶车辆行驶通过驾驶环境时由安装在自动驾驶车辆上的传感器捕获；识别图像中的第一图像，第一图像包括具有第一尺寸的第一对象，第一对象由对象检测器使用对象检测算法基于第一图像检测和识别；以及响应于所识别的第一对象，基于由图像的列表表示的自动驾驶车辆的移动轨迹，按时间往回遍历列表中的图像，以识别包括具有第二尺寸的第二对象的第二图像，以及标记第二图像中的、与第一图像中的第一对象对应的第二对象，其中，具有经标记的第二图像的图像的列表在自动驾驶期间被用于后续的对象检测。

本申请的又一方面提供了数据处理系统。该数据处理系统可包括处理器以及存储器，存储器联接至处理器以存储指令，所述指令在由所述处理器运行时使得所述处理器执行操作。所述操作可包括：接收按时间顺序捕获的图像的列表，其中，图像中的每个在自动驾驶车辆行驶通过驾驶环境时由安装在自动驾驶车辆上的传感器捕获；识别图像中的第一图像，第一图像包括具有第一尺寸的第一对象，第一对象由对象检测器使用对象检测算法基于第一图像检测和识别；以及响应于所识别的第一对象，基于由图像的列表表示的自动驾驶车辆的移动轨迹，按时间往回遍历列表中的图像，以识别包括具有第二尺寸的第二对象的第二图像，以及标记第二图像中的、与第一图像中的第一对象对应的第二对象，其中，具有经标记的第二图像的图像的列表在自动驾驶期间被用于后续的对象检测。

附图说明

本公开的实施方式以示例而非限制的方式示出在附图的各图中，在附图中，类似附图标记指示类似的元件。

图1是示出根据一个实施方式的网络化系统的框图。

图2是示出根据一个实施方式的自动驾驶车辆的示例的框图。

图3A至图3B是示出根据一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。

图4是示出根据一个实施方式的对象检测和追踪系统的框图。

图5是示出根据一个实施方式的自动对象标记系统的过程的框图。

图6A和图6B是示出根据一个实施方式的标记对象的过程的视图。

图7是示出根据一个实施方式的自动车道线标记系统的过程的框图。

图8A和图8B是示出根据特定实施方式的自动车道线标记过程的屏幕截图。

图9是示出根据一个实施方式的自动对象标记的过程的流程图。

具体实施方式

将参考以下所讨论的细节来描述本公开的各种实施方式和方面，附图将示出所述各种实施方式。下列描述和附图是对本公开的说明，而不应当解释为限制本公开。描述了许多特定细节以提供对本公开各种实施方式的全面理解。然而，在某些情况下，并未描述众所周知的或常规的细节以提供对本公开的实施方式的简洁讨论。

本说明书中对“一个实施方式”或“实施方式”的引述意味着结合该实施方式所描述的特定特征、结构或特性可包括在本公开的至少一个实施方式中。短语“在一个实施方式中”在本说明书中各处的记载不必全部指同一实施方式。

根据一些实施方式，传感器数据(例如，图像、点云)可以在各种车辆的行驶期间被记录并存储在永久性存储装置中。然后，传感器数据可以被离线利用，以基于传感器数据的“轨迹”对已检测到的特定对象自动标记或标注，而无需用户干预。在一个实施方式中，如果图像(例如，相机图像或点云图像)包括由对象检测器检测到的对象，则标记系统“后退”并遍历其它图像，以识别与检测到的对象对应的、在先前的时间点处无法被对象检测器检测到(例如，由于对象太小、模糊或者被部分或完全地遮挡)的配对对象，并标记该配对对象。类似地，例如，可以基于按时间顺序捕获的图像对车道线也进行插补或连接。结果，可以减少传统的冗长的人工标记过程。

根据一个实施方式，接收图像的列表(例如，由相机、LIDAR装置和/或RADAR装置捕获的图像)。在行驶通过驾驶环境的同时，由ADV的传感器按时间顺序捕获所述图像。识别图像的包括具有第一尺寸(例如，较大尺寸)的第一对象的第一图像，所述第一对象由对象检测器使用对象检测算法检测到。响应于第一对象的检测，基于由图像的列表表示的ADV的移动轨迹，从第一图像开始按时间往回遍历列表中的图像，以识别包括具有第二尺寸(例如，较小尺寸)的第二对象的第二图像。然后，在第二图像中对第二对象标记或标注，该第二对象与第一图像中的第一对象(称为与第一图像配对的图像)对应。具有经标记的第二图像的图像的列表可以在自动驾驶期间用于后续的对象检测。

在一个实施方式中，可以使用其中包括被标注的第二图像的图像的列表对对象检测算法进行训练。第一对象可以表示车道标识，例如ADV正在其中行驶的车道的车道线，或者第一对象可以表示ADV附近的障碍物。第一图像是在第一时间点时捕获的，并且第二图像是在第一时间点之前的第二时间点时捕获的。

在一个实施方式中，第一图像中具有第一尺寸的第一对象表示可被对象检测器检测到的、距离ADV更近的视图。第二图像中具有第二尺寸的第二对象表示无法被对象检测器使用对象检测算法检测到的、距离ADV较远的视图。通过追踪列表中的第一图像与第二图像之间的一个或多个图像中的相应对象的相对位置，第二图像的第二对象被识别为与第一图像的第一对象对应。在一个实施方式中，当ADV行驶通过驾驶环境时，在线检测第一图像中的第一对象，并且通过遍历列表中的图像来离线检测第二图像的第二对象。

图1是示出根据本公开的一个实施方式的自动驾驶车辆网络配置的框图。参考图1，网络配置100包括可以通过网络102通信地联接到一个或多个服务器103至104的自动驾驶车辆101。尽管示出一个自动驾驶车辆，但是多个自动驾驶车辆可以通过网络102联接到彼此和/或联接到服务器103至104。网络102可以是任何类型的网络，例如，有线或无线的局域网(LAN)、诸如互联网的广域网(WAN)、蜂窝网络、卫星网络或其组合。服务器103至104可以是任何类型的服务器或服务器群集，诸如，Web或云服务器、应用服务器、后端服务器或其组合。服务器103至104可以是数据分析服务器、内容服务器、交通信息服务器、地图和兴趣点(MPOI)服务器或者位置服务器等。

自动驾驶车辆是指可以被配置成处于自动驾驶模式中的车辆，在所述自动驾驶模式中，车辆在极少或没有来自驾驶员的输入的情况下导航通过环境。这种自动驾驶车辆可包括传感器系统，所述传感器系统具有配置成检测与车辆运行环境有关的信息的一个或多个传感器。所述车辆和其相关联的控制器使用所检测的信息来导航通过所述环境。自动驾驶车辆101可以在手动模式中、在全自动驾驶模式中或者在部分自动驾驶模式中运行。

在一个实施方式中，自动驾驶车辆101包括但不限于感知与规划系统110、车辆控制系统111、无线通信系统112、用户接口系统113和传感器系统115。自动驾驶车辆101还可包括普通车辆中包括的某些常用部件，诸如：发动机、车轮、方向盘、变速器等，所述部件可以由车辆控制系统111和/或感知与规划系统110使用多种通信信号和/或命令进行控制，该多种通信信号和/或命令例如是加速信号或命令、减速信号或命令、转向信号或命令、制动信号或命令等。

部件110至115可以经由互连件、总线、网络或其组合通信地联接到彼此。例如，部件110至115可以经由控制器局域网(CAN)总线通信地联接到彼此。CAN总线是设计成允许微控制器和装置在没有主机的应用中与彼此通信的车辆总线标准。它是最初是为汽车内的复用电气布线设计的基于消息的协议，但也用于许多其它环境。

现在参考图2，在一个实施方式中，传感器系统115包括但不限于一个或多个相机211、全球定位系统(GPS)单元212、惯性测量单元(IMU)213、雷达单元214以及光探测和测距(LIDAR)单元215。GPS单元212可包括收发器，所述收发器可操作以提供关于自动驾驶车辆的位置的信息。IMU单元213可以基于惯性加速度来感测自动驾驶车辆的位置和定向变化。雷达单元214可以表示利用无线电信号来感测自动驾驶车辆的本地环境内的对象的系统。在一些实施方式中，除感测对象之外，雷达单元214可以另外感测对象的速度和/或前进方向。LIDAR单元215可以使用激光来感测自动驾驶车辆所处环境中的对象。除其它系统部件之外，LIDAR单元215还可包括一个或多个激光源、激光扫描器以及一个或多个检测器。相机211可包括用来收集自动驾驶车辆周围环境的图像的一个或多个装置。相机211可以是静物相机和/或视频相机。相机可以是可机械地移动的，例如，通过将相机安装在旋转和/或倾斜平台上。

传感器系统115还可包括其它传感器，诸如：声纳传感器、红外传感器、转向传感器、油门传感器、制动传感器以及音频传感器(例如，麦克风)。音频传感器可以被配置成从自动驾驶车辆周围的环境中收集声音。转向传感器可以被配置成感测方向盘、车辆的车轮或其组合的转向角度。油门传感器和制动传感器分别感测车辆的油门位置和制动位置。在一些情形下，油门传感器和制动传感器可以集成为集成式油门/制动传感器。

在一个实施方式中，车辆控制系统111包括但不限于转向单元201、油门单元202(也被称为加速单元)和制动单元203。转向单元201用来调整车辆的方向或前进方向。油门单元202用来控制马达或发动机的速度，马达或发动机的速度进而控制车辆的速度和加速度。制动单元203通过提供摩擦使车辆的车轮或轮胎减速而使车辆减速。应注意，如图2所示的部件可以以硬件、软件或其组合实施。

回到图1，无线通信系统112允许自动驾驶车辆101与诸如装置、传感器、其它车辆等的外部系统之间的通信。例如，无线通信系统112可以与一个或多个装置直接无线通信，或者经由通信网络进行无线通信，诸如，通过网络102与服务器103至104通信。无线通信系统112可以使用任何蜂窝通信网络或无线局域网(WLAN)，例如，使用WiFi，以与另一部件或系统通信。无线通信系统112可以例如使用红外链路、蓝牙等与装置(例如，乘客的移动装置、显示装置、车辆101内的扬声器)直接通信。用户接口系统113可以是在车辆101内实施的外围装置的部分，包括例如键盘、触摸屏显示装置、麦克风和扬声器等。

自动驾驶车辆101的功能中的一些或全部可以由感知与规划系统110控制或管理，尤其当在自动驾驶模式下操作时。感知与规划系统110包括必要的硬件(例如，处理器、存储器、存储设备)和软件(例如，操作系统、规划和路线安排程序)，以从传感器系统115、控制系统111、无线通信系统112和/或用户接口系统113接收信息，处理所接收的信息，规划从起始点到目的地点的路线或路径，随后基于规划和控制信息来驾驶车辆101。替代地，感知与规划系统110可以与车辆控制系统111集成在一起。

例如，作为乘客的用户可以例如经由用户接口来指定行程的起始位置和目的地。感知与规划系统110获得行程相关数据。例如，感知与规划系统110可以从MPOI服务器中获得位置和路线信息，所述MPOI服务器可以是服务器103至104的一部分。位置服务器提供位置服务，并且MPOI服务器提供地图服务和某些位置的POI。替代地，此类位置和MPOI信息可以本地高速缓存在感知与规划系统110的永久性存储装置中。

当自动驾驶车辆101沿着路线移动时，感知与规划系统110还可以从交通信息系统或服务器(TIS)获得实时交通信息。应注意，服务器103至104可以由第三方实体进行操作。替代地，服务器103至104的功能可以与感知与规划系统110集成在一起。基于实时交通信息、MPOI信息和位置信息以及由传感器系统115检测或感测的实时本地环境数据(例如，障碍物、对象、附近车辆)，感知与规划系统110可以规划最佳路线并且根据所规划的路线例如经由控制系统111来驾驶车辆101，以安全且高效到达指定目的地。

服务器103可以是为多种客户端执行数据分析服务的数据分析系统。在一个实施方式中，服务器103包括数据收集器121和机器学习引擎122。数据收集器121从各种车辆(自动驾驶车辆或由人类驾驶员所驾驶的常规车辆)收集驾驶统计数据123。驾驶统计数据123包括表明在不同的时间点时发出的驾驶命令(例如，油门命令、制动命令、转向命令)以及车辆的传感器所捕获的车辆的响应(例如速度、加速、减速、方向)的信息。驾驶统计数据123还可包括描述不同的时间点处的驾驶环境的信息，诸如，例如路线(包括起始位置和目的地位置)、MPOI、道路状况、天气状况等。

基于驾驶统计数据123，机器学习引擎122出于多种目的而生成或训练一组规则、算法和/或预测模型124。在一个实施方式中，算法124可以包括用于对由ADV的一个或多个传感器捕获的图像中的对象自动标记或标注的算法。然后，可以将算法124上载到ADV上，以在自动驾驶过程期间实时地利用。服务器103还可以包含标记系统125，其被配置成对由ADV捕获的图像中的对象自动标记，这将在下面进一步详细描述。

图3A和图3B是示出根据一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。系统300可以被实施为图1的自动驾驶车辆101的一部分，包括但不限于感知与规划系统110、控制系统111和传感器系统115。参考图3A至图3B，感知与规划系统110包括但不限于定位模块301、感知模块302、预测模块303、决策模块304、规划模块305、控制模块306、路线安排模块307和对象追踪模块308。

模块301至308中的一些或全部可以以软件、硬件或其组合实施。例如，这些模块可以安装在永久性存储装置352中、加载到存储器351中，并且由一个或多个处理器(未示出)执行。应注意，这些模块中的一些或全部可以通信地联接到图2的车辆控制系统111的一些或全部模块或者与它们集成在一起。模块301至308中的一些可以一起集成为集成模块。

定位模块301(例如，利用GPS单元212)确定自动驾驶车辆300的当前位置，并管理与用户的行程或路线相关的任何数据。定位模块301(也被称为地图与路线模块)管理与用户的行程或路线相关的任何数据。用户可以例如经由用户接口登录并且指定行程的起始位置和目的地。定位模块301与自动驾驶车辆300的诸如地图和路线信息311的其它部件通信，以获得行程相关数据。例如，定位模块301可以从位置服务器和地图与POI(MPOI)服务器获得位置和路线信息。位置服务器提供位置服务，并且MPOI服务器提供地图服务和某些位置的POI，这些服务和POI可以作为地图和路线信息311的一部分高速缓存。当自动驾驶车辆300沿着路线移动时，定位模块301也可以从交通信息系统或服务器获得实时交通信息。

基于由传感器系统115提供的传感器数据和由定位模块301获得的定位信息，感知模块302确定对周围环境的感知。感知信息可以表示普通驾驶员在驾驶员正驾驶的车辆周围将感知到的东西。感知可包括例如对象形式的车道配置、交通灯信号、另一车辆的相对位置、行人、建筑物、人行横道、十字路口或其它交通相关标志(例如，停止标志、让行标志)等。车道配置包括描述一条车道或多条车道的信息，例如，车道的形状(例如，直线或弯曲)、车道的宽度、道路中的车道数目、单向车道或双向车道、合流车道或分流车道、出口车道等。

感知模块302可包括计算机视觉系统或计算机视觉系统的功能，以处理并分析由一个或多个相机捕获的图像，从而识别自动驾驶车辆环境中的对象和/或特征。所述对象可包括交通信号、道路边界、其它车辆、行人和/或障碍物等。计算机视觉系统可以使用对象识别算法、视频追踪以及其它计算机视觉技术。在一些实施方式中，计算机视觉系统可以绘制环境地图，追踪对象，以及估算对象的速度等。感知模块302也可以基于由诸如雷达和/或LIDAR的其它传感器提供的其它传感器数据来检测对象。

针对每个对象，预测模块303预测所述对象在所述情况下的行为。基于在某时间点感知驾驶环境的感知数据根据地图/路线信息311与交通规则312的集合来执行所述预测。例如，如果对象是相反方向处的车辆且当前驾驶环境包括十字路口，则预测模块303将预测该车辆是可能向前直行还是可能转弯。如果感知数据表明十字路口没有交通灯，则预测模块303可预测该车辆可能在进入十字路口之前必须完全停下。如果感知数据表明该车辆当前处于左转专用车道或右转专用车道，则预测模块303可分别预测该车辆更可能进行左转或右转。

针对每个对象，决策模块304作出关于如何处置对象的决定。例如，针对特定对象(例如，交叉路线中的另一车辆)以及描述对象的元数据(例如，速度、方向、转弯角度)，决策模块304决定如何与所述对象相遇(例如，超车、让行、停止、经过)。决策模块304可以根据诸如交通规则或驾驶规则312的规则集来作出此类决定，所述规则集可以存储在永久性存储装置352中。

路线安排模块307配置成提供从起始点到终点的一个或多个路线或路径。对于例如从用户处接收到的从起始位置到目的地位置的给定行程，路线安排模块307获取地图和路线信息311，并确定从起始位置到达目的地位置的所有可能的路线或路径。对于确定了从起始位置到达目的地位置的路线中的每一个，路线安排模块307可以以地形图的形式生成参考线路。参考线路表示没有诸如其它车辆、障碍物或交通状况的任何干扰的理想路线或理想路径。即，如果道路上没有其它车辆、行人或障碍物，则ADV应精确地或接近地遵循参考线路。随后可向决策模块304和/或规划模块305提供地形图。根据由其它模块提供的其它数据(诸如，来自定位模块301的交通状况、感知模块302感知的驾驶环境和预测模块303预测的交通状况)，决策模块304和/或规划模块305检验所有可能的路线，以选择并修正最佳路线中的一条。取决于在某时间点时的特定的驾驶环境，用于控制ADV的实际路径或路线可接近于或不同于由路线安排模块307提供的参考线路。

基于针对所感知到的对象中的每个的决定，规划模块305使用路线安排模块307提供的参考线路作为基础，为自动驾驶车辆规划路径或路线以及驾驶参数(例如，距离、速度和/或转弯角度)。即，针对给定的对象，决策模块304决定对对象做什么，而规划模块305确定如何去做。例如，针对给定的对象，决策模块304可以决定经过所述对象，而规划模块305可以确定在所述对象的左侧还是右侧经过。规划和控制数据由规划模块305生成，包括描述车辆300在下一移动周期(例如，下一路线/路径段)中将如何移动的信息。例如，规划和控制数据可以指示车辆300以30英里每小时(mph)的速度移动10米，随后以25mph的速度变到右侧车道。

基于规划和控制数据，控制模块306根据由规划和控制数据限定的路线或路径通过将适当的命令或信号发送到车辆控制系统111来控制并驾驶自动驾驶车辆。所述规划和控制数据包括足够的信息，以沿着路径或路线在不同的时间点使用适当的车辆设置或驾驶参数(例如，油门、制动和转向命令)将车辆从路线或路径的第一点驾驶到第二点。

在一个实施方式中，规划阶段在多个规划周期(也称为驾驶周期)中执行，诸如，以例如每100毫秒(ms)的时间间隔执行。针对每个规划周期或驾驶周期，将基于规划和控制数据发出一个或多个控制命令。即，对于每个100ms，规划模块305规划下一路线段或路径段，例如，包括目标位置和ADV到达该目标位置所需的时间。替代地，规划模块305还可指定具体速度、方向和/或转向角度等。在一个实施方式中，规划模块305为下一预定的时间段(诸如5秒)规划路线段或路径段。对于每个规划周期，规划模块305基于先前周期中所规划的目标位置为当前周期(例如，下个5秒)规划目标位置。控制模块306随后基于当前周期的规划和控制数据生成一个或多个控制命令(例如，油门控制命令、制动控制命令、转向控制命令)。

应注意，决策模块304和规划模块305可以集成为集成模块。决策模块304/规划模块305可包括导航系统或导航系统的功能，以确定自动驾驶车辆的驾驶路径。例如，导航系统可以确定用于实现自动驾驶车辆沿着以下路径移动的一系列速度和前进方向：所述路径在使自动驾驶车辆沿着通往最终目的地的基于车行道的路径前进的同时，基本上避免感知到的障碍物。目的地可以根据经由用户接口系统113进行的用户输入来设定。导航系统可以在自动驾驶车辆正在运行的同时动态地更新驾驶路径。导航系统可以将来自GPS系统和一个或多个地图的数据合并，以确定用于自动驾驶车辆的驾驶路径。

根据一个实施方式，对象追踪模块308配置成追踪由感知模块302检测到的障碍物的运动历史以及ADV的运动历史。可替代地，对象追踪模块308包括对象检测器，以检测和识别静态对象并对所检测的静态对象加标记。对象追踪模块308可以实现为感知模块302的一部分。障碍物和ADV的运动历史可以作为驾驶统计数据313的一部分存储在存储器351和/或永久性存储装置352中维持的相应的障碍物状态缓冲器和车辆状态缓冲器中。对于由感知模块302检测到的每个障碍物，确定预定时间段内的不同时间点时的障碍物状态，并将其保持在障碍物状态缓冲器中，该障碍物状态缓冲器与保持在存储器351中的障碍物相关联，以进行快速访问。障碍物状态可以进一步被刷新，并且作为驾驶统计数据313的一部分存储在永久性存储装置352中。保持在存储器351中的障碍物状态可以保持较短的时间段，而存储在永久性存储装置352中的障碍物状态可以保持较长的时间段。类似地，ADV的车辆状态也可以作为驾驶统计数据313的一部分被保持在存储器351和永久性存储装置352两者中。

此外，由ADV的传感器(例如，相机、LIDAR、RADAR)捕获的图像可以作为图像314的一部分存储在永久性存储装置352中。这些图像中的一些可以包括由对象追踪模块308和/或感知模块302检测到并标注的对象。图像314可以由数据分析系统(诸如，服务器103的对象标记系统125)进行离线分析，例如，基于能够由对象检测器检测到的对象，对无法被对象检测器在线检测到的对象自动标记或标注。

图4是示出根据一个实施方式的对象追踪系统的框图。参照图4，对象追踪模块308包括可以实现为集成模块的车辆追踪模块401和障碍物追踪模块402。车辆追踪模块401配置成至少基于从GPS单元212接收的GPS信号和/或从IMU 213接收的IMU信号来追踪ADV的运动。车辆追踪模块401可以基于GPS/IMU信号来执行运动估计，以确定不同时间点时的车辆状态，诸如位置、速度和行进方向。然后，将车辆状态存储在车辆状态缓冲器403中。在一个实施方式中，存储在车辆状态缓冲器403中的车辆状态可以仅包含车辆在具有固定时间增量的不同时间点时的位置。因此，可以基于固定递增的时间戳处的位置，推导出速度和行进方向。可替代地，车辆状态可以包括丰富的车辆状态元数据集，其包括位置、速度、行进方向、加速/减速以及所发出的控制命令。

在一个实施方式中，障碍物追踪模块402配置成追踪基于从各种传感器(诸如，以相机211、LIDAR 215和/或RADAR 214为例)获得的传感器数据而检测到的障碍物。障碍物追踪模块402可以包括相机对象检测器/追踪模块以及LIDAR对象检测器/追踪模块，以分别检测并追踪由图像捕获的障碍物和由LIDAR点云捕获的障碍物。可以对由相机对象检测器/追踪模块以及LIDAR对象检测器/追踪模块提供的输出执行数据融合运算。在一个实施方式中，相机对象检测器/追踪模块以及LIDAR对象检测器/追踪模块可以以神经网络预测模型实现，以预测和追踪障碍物的运动。然后，将障碍物的障碍物状态存储在障碍物状态缓冲器404中。障碍物状态与如上所述的车辆状态类似或相同。

在一个实施方式中，针对检测到的障碍物中的每个分配障碍物状态缓冲器，以具体存储相应障碍物的障碍物状态。在一个实施方式中，车辆状态缓冲器和障碍物状态缓冲器中的每个均实现为类似于先进先出(FIFO)缓冲器的环形缓冲器，以保持与预定时间段相关联的预定量的数据。存储在障碍物状态缓冲器404中的障碍物状态可以用于预测障碍物的未来运动，从而可以为ADV规划更好的路径以避免与障碍物发生碰撞。

例如，在某些情况下，障碍物可能被ADV无法“观察到”的另一对象阻挡。然而，基于该障碍物的先前障碍物状态，即使该障碍物在视线之外，也可以预测进一步的移动轨迹。这是很重要的，原因在于，障碍物在某一时刻时可能处于盲点，并且ADV需要通过考虑障碍物的未来位置进行规划，以避免潜在的碰撞。可替代地，可以基于障碍物的轨迹来确定交通流或交通拥堵。

根据一个实施方式，可以利用障碍物在一段时间内的障碍物状态来对障碍物曾经移动的轨迹进行重建。可以使用一个或多个障碍物在驾驶环境中的重建轨迹来通过创建虚拟车道而确定或预测道路的车道配置。车道配置可以包括车道的数量、车道宽度、车道形状或曲率和/或车道中心线。例如，基于障碍物流中的多个流的交通流，可以确定车道的数量。此外，障碍物或移动对象通常在车道的中心处移动。因此，通过追踪障碍物的运动轨迹，可以预测车道中心线。此外，也可以基于所预测的车道中心线，通过观察障碍物宽度加上政府规定的所需的最小间隙空间来确定车道宽度。当ADV在车道标识不可用或不够清楚的农村地区行驶时，这种车道配置预测是特别有用的。

根据另一实施方式，如果需要跟随或尾随另一移动的障碍物，则可以基于从相应的障碍物状态缓冲器恢复的障碍物状态来重构该障碍物先前的移动轨迹。然后，可以基于待跟随的障碍物的所重构的轨迹来规划尾随的路径。

根据一个实施方式，对象追踪模块308还可以包括对象检测/标记模块407。模块407配置成检测图像中的对象、识别出对象是什么类型并且在图像中标记出所检测的对象。应注意的是，对象检测/标记模块407能够在对象接近ADV(例如，更大和更清楚)时识别出对象。然而，当对象远离ADV时，对象可能显得更小，并且对象检测/标记模块407可能无法检测并识别出该对象。因此，图像中的一些可以包括由对象检测/标记模块407检测到的对象，而即使其他图像中存在相同的对象但由于对象的尺寸较小，使得其他图像可能无法被对象检测/标记模块407检测到。然后，将图像作为图像314的一部分存储在永久性存储装置352中，可以通过例如图1的对象标记系统125对其进行离线分析来自动标记。

现在参考图1，在一个实施方式中，对象标记系统125包括对象检测模块131和对象标记模块132。在给定按时间顺序捕获的图像的列表的情况下，对象检测模块131配置成检测包含在图像中的对象，或识别(例如，通过图4的对象检测/标记模块407)先前检测且被标注的对象。响应于包含在第一图像中的第一对象的检测，对象标记模块132基于由图像的列表表示的ADV的移动轨迹从第一图像开始按时间往回遍历列表中的图像，以识别第二图像，其中，第二图像包括具有第二尺寸(例如，较小尺寸)的第二对象。然后，由对象标记模块132在第二图像中对第二对象标记或标注，第二对象(称为第一图像的配对图像)与第一图像中的第一对象对应。例如，如果对象被识别为建筑物，则对象标记模块132将在第二图像中指明该对象是建筑物。具有经标记的第二图像的图像列表可以在自动驾驶期间用于后续对象检测。对象标记模块132配置成往回遍历表示预定时间周期或预定距离(例如，200米)的预定数量的图像。

在一个实施方式中，可以使用其中包括经标注的第二图像的图像列表对由对象检测器407使用的对象检测算法进行训练。第一对象可以表示车道标识，诸如ADV正在其中行驶的车道的车道线，或者第一对象可以表示ADV附近的障碍物。第一对象可以表示交通标志、交通灯、立杆、十字路口或人行横道。第一图像是在第一时间点时捕获的，并且第二图像是在第一时间点之前的第二时间点时捕获的。

在一个实施方式中，第一图像中的具有第一尺寸的第一对象表示可被对象检测器检测到的、距ADV较近的视图。第二图像中的具有第二尺寸的第二对象表示不能被对象检测器使用对象检测算法检测到的、距ADV较远的视图。通过追踪列表中的第一图像与第二图像之间的一个或多个图像中的相应对象的相对位置，将第二图像的第二对象识别为对应于第一图像的第一对象。在一个实施方式中，当ADV行驶通过驾驶环境时，在线检测第一图像中的第一对象，并且通过遍历列表中的图像来离线检测第二图像的第二对象。

出于说明的目的，现在参考图5，给定图像500的列表，对象检测模块131配置成识别包含由对象检测模块131检测到或由另一对象检测器(例如，对象检测器407)先前检测到的对象511的第一图像501。基于第一图像501，对象标记模块132按时间往回遍历，以识别第二图像(在该示例中，包含与检测到的对象511相关的配对对象512的图像502)。如图5所示，对象511表示近的视图中的对象，而对象512表示远的视图中的相同对象。由于对象512的尺寸较小，在线对象检测器可能无法检测到它。通过按时间顺序自动往回遍历图像，系统能够将对象512识别并标记为对象511的配对对象。至少具有被标记的对象512的图像500的列表可以被用于随后训练对象检测器。

图6A和图6B示出了根据一个实施方式的驾驶环境的不同视图。图6A是俯视图，并且图6B表示图像视图。参照图6A，在自动驾驶期间，记录ADV的移动历史(例如从点601到点602)，并且如上所述地将其存储在永久性存储装置中。当检测到对象603时，自动标记系统在时间上从点602朝向点601后退预定距离(例如，与点602相距200米)，以追溯性地标记例如由于尺寸小、局部遮挡或完全遮挡而无法进行标记的那些图像中的相同的对象。

类似地，如图7所示，也可以使用对象标记系统125来标记车道线。现参考图7，当ADV驾驶通过车道时，传感器能够在近的视图中检测并识别车道线的段，例如由较厚的段表示的车道线段。然后，可以如所描述的那样对所捕获的图像进行离线分析，以“连接”车道线段，从而形成连续的车道线。当如图8A所示车道是车道线的一部分被前方的障碍物遮挡而隐藏的弯曲车道时，这种技术通常是有用的。参照图8A，弯曲的车道线被前方的车辆阻挡。同样如图8B所示，通过遍历一系列的图像，可以识别并标注隐藏的车道线或被阻挡的车道线。参照图8B，车道线的较远部分被前方的车辆阻挡，但是可以通过如上所述的对象标记系统识别并标记车道线。

图9是示出根据一个实施方式的标记对象的过程的示例的流程图。过程900可以由可包括软件、硬件或其组合的处理逻辑来执行。例如，过程900可以由对象标记系统125执行。参照图9，在框901处，处理逻辑接收按时间顺序捕获的图像的列表。图像中的每个是在ADV行驶通过驾驶环境时通过安装在ADV上的传感器捕获的。在框902处，处理逻辑识别包括具有第一尺寸(例如，较大尺寸)的第一对象的第一图像，其中，所述第一对象是通过对象检测器使用对象检测算法基于第一图像而被检测并识别的。响应于第一对象，在框903处，处理逻辑基于由图像的列表表示的ADV的移动轨迹按时间往回遍历列表中的图像，以识别包括具有第二尺寸(例如，较小尺寸)的第二对象的第二图像。在框904处，标记第二图像中的与第一图像中的第一对象对应的第二对象。具有被标记的第二图像的图像的列表可以在自动驾驶期间用于后续对象检测。

应注意，如示出和以上描述的部件中的一些或全部可以以软件、硬件或其组合实施。例如，此类部件可以实施为安装并存储在永久性存储装置中的软件，所述软件可以加载在存储器中并通过处理器(未示出)执行以实施本申请全文中所述的过程或操作。可替代地，此类部件可以实施为编程或嵌入到专用硬件(诸如，集成电路(例如，专用集成电路或ASIC)、数字信号处理器(DSP)或现场可编程门阵列(FPGA))中的可执行代码，所述可执行代码可以经由来自应用的相应驱动器和/或操作系统来访问。此外，此类部件可以实施为处理器或处理器内核中的特定硬件逻辑，作为可由软件部件通过一个或多个特定指令访问的指令集的一部分。

前述详细描述中的一些部分已经根据在计算机存储器内对数据位的运算的算法和符号表示而呈现。这些算法描述和表示是数据处理领域中的技术人员所使用的方式，以将他们的工作实质最有效地传达给本领域中的其他技术人员。本文中，算法通常被认为是导致所期望结果的自洽操作序列。这些操作是指需要对物理量进行物理操控的操作。

然而，应当牢记，所有这些和类似的术语均旨在与适当的物理量关联，并且仅仅是应用于这些量的便利性标记。除非显而易见地在以上讨论中以其它方式明确地指出，否则应当理解，在整个说明书中，利用术语(诸如所附权利要求书中所提出的术语)进行的讨论是指计算机系统或类似电子计算装置的动作和处理，所述计算机系统或电子计算装置操控计算机系统的寄存器和存储器内的表示为物理(电子)量的数据，并将所述数据变换成计算机系统存储器或寄存器或者其它此类信息存储设备、传输或显示装置内类似地表示为物理量的其它数据。

本公开的实施方式还涉及用于执行本文中的操作的设备。这种计算机程序被存储在非暂时性计算机可读介质中。机器可读介质包括用于以机器(例如，计算机)可读的形式存储信息的任何机构。例如，机器可读(例如，计算机可读)介质包括机器(例如，计算机)可读存储介质(例如，只读存储器(“ROM”)、随机存取存储器(“RAM”)、磁盘存储介质、光存储介质、闪存存储器装置)。

前述附图中所描绘的过程或方法可以由处理逻辑来执行，所述处理逻辑包括硬件(例如，电路、专用逻辑等)、软件(例如，实现在非暂时性计算机可读介质上)或两者的组合。尽管所述过程或方法在上文是依据一些顺序操作来描述的，但是应当理解，所述操作中的一些可以按不同的顺序执行。此外，一些操作可以并行地执行而不是顺序地执行。

本公开的实施方式并未参考任何特定的编程语言进行描述。应理解，可以使用多种编程语言来实施如本文描述的本公开的实施方式的教导。

在以上的说明书中，已经参考本公开的具体示例性实施方式对本公开的实施方式进行了描述。将显而易见的是，在不脱离所附权利要求书中阐述的本公开的更宽泛精神和范围的情况下，可以对本公开作出各种修改。因此，应当在说明性意义而不是限制性意义上来理解本说明书和附图。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 用于自动驾驶的基于当前帧的对象检测自动标记先前帧中的对象的方法 [P] . 中国专利： CN112183175A . 2021-01-05
2. 基于DFL-CNN网络的视频帧内对象移除篡改检测方法 [P] . 中国专利： CN111212291A . 2020-05-29
3. Digital audio signal coding/decoding method for telecommunication application, involves applying short and window to code current frame, when event is detected at start of current frame and not detected in current frame, respectively [P] . 法国专利： FR2911227A1 . 2008-07-11

机译：用于电信应用的数字音频信号编码/解码方法，涉及当在当前帧的开始处检测到事件而在当前帧中未检测到事件时，对当前帧应用短和窗口编码。
4. Method and device for counting objects in image data in frames, a frame of said image data in frames including at least one object, such as cans, bottles, and packaging, computer program and computer program product [P] . 美国专利： US10325375B2 . 2019-06-18

机译：用于以帧为单位对图像数据中的对象进行计数的方法和设备，所述图像数据的帧以帧为单位包括至少一个对象，例如罐，瓶和包装，计算机程序和计算机程序产品
5. Object detection device for recognizing an object in an input frame image using past frame image information [P] . 美国专利： US9652677B2 . 2017-05-16

机译：用于使用过去的帧图像信息来识别输入帧图像中的对象的对象检测装置