首页> 中国专利> 对象识别方法、对象识别装置及存储介质

对象识别方法、对象识别装置及存储介质

页面导航

摘要
著录项
说明书
相似文献

摘要

本公开是关于一种对象识别方法、对象识别装置及存储介质。其中，对象识别方法包括：基于多目近红外成像设备在暗光环境下对待识别对象拍摄得到的影像，确定待识别对象在暗光环境下的多张图像，多张图像中包括待识别对象在不同视角下的图像；基于多张图像，确定待识别对象的立体深度图像；基于立体深度图像，对待识别对象进行识别，得到识别结果。通过本公开实施例提供的对象识别方法，可以实现在暗光环境下对待识别对象的快速识别和追踪。

著录项

公开/公告号CN112883791A

专利类型发明专利
公开/公告日2021-06-01

原文格式PDF
申请/专利权人北京小米移动软件有限公司;
展开▼

申请/专利号CN202110057696.1
发明设计人李华强;
展开▼

申请日2021-01-15
分类号G06K9/00(20060101);G06K9/62(20060101);G06N3/04(20060101);
代理机构11722 北京钲霖知识产权代理有限公司;
代理人李志新;刘亚平
地址 100085 北京市海淀区西二旗中路33号院6号楼8层018号
入库时间 2023-06-19 11:11:32

说明书

技术领域

本公开涉及对象识别技术领域，尤其涉及一种对象识别方法、对象识别装置及存储介质。

背景技术

根据相关技术可知，目前，往往利用结构光(Structure Light)、飞行时间技术(Time of Flight)或双目立体成像技术(Dual-Camera)形成关于待识别对象的3D深度立体图像(又称立体深度图像)，并结合人工智能神经网络技术实现对待识别对象的识别和追踪。

但是，由于利用结构光(Structure Light)、飞行时间技术(Time of Flight)或双目立体成像技术(Dual-Camera)形成关于待识别对象的立体深度图像，往往过度依赖于强光条件，因此，无法实现在夜视或暗光环境下完成对待识别对象的识别和追踪。

发明内容

为克服相关技术中存在的问题，本公开提供一种对象识别方法、对象识别装置及存储介质。

根据本公开实施例的第一方面，提供一种对象识别方法。其中，对象识别方法包括：基于多目近红外成像设备在暗光环境下对待识别对象拍摄得到的影像，确定所述待识别对象在暗光环境下的多张图像，所述多张图像中包括所述待识别对象在不同视角下的图像；基于所述多张图像，确定所述待识别对象的立体深度图像；基于所述立体深度图像，对所述待识别对象进行识别，得到识别结果。

在本公开一种实施方式中，所述基于多目近红外成像设备在暗光环境下对待识别对象拍摄得到的影像，确定所述待识别对象在暗光环境下的多张图像，包括：基于至少两个多目近红外成像设备，在暗光环境下从多个不同视角拍摄待识别对象，得到对应所述多个不同视角的多张图像。

在本公开另一种实施方式中，所述基于多目近红外成像设备在暗光环境下对待识别对象拍摄得到的影像，确定所述待识别对象在暗光环境下的多张图像，包括：基于一个或多个多目近红外成像设备，在暗光环境下拍摄待识别对象，得到一个或多个影像视频；在所述一个或多个影像视频中，提取包括所述待识别对象在多个不同视角的多张图像。

在本公开又一种实施方式中，基于所述多张图像，确定所述待识别对象的立体深度图像，包括：在所述多张图像中确定第一图像，并确定所述第一图像中的多个不同位置；针对所述多个不同位置中的各位置，分别确定所述多张图像中在所述位置的视差以及深度信息；基于所述多个不同位置各自对应的视差以及深度信息，确定所述待识别对象的三维信息；基于所述三维信息，确定所述待识别对象的立体深度图像。

在本公开又一种实施方式中，所述基于所述立体深度图像，对所述待识别对象进行识别，包括：调用基于立体深度图像预先训练的人工智能神经网络模型；基于所述人工智能神经网络模型，对所述待识别对象进行识别。

在本公开又一种实施方式中，所述对象识别方法还包括：基于所述待识别对象在设定时间内的多个识别结果，对所述待识别对象行为追踪。

根据本公开实施例的第二方面，提供一种对象识别装置。其中，所述对象识别装置法包括：确定图像模块，用于基于多目近红外成像设备在暗光环境下对待识别对象拍摄得到的影像，确定所述待识别对象在暗光环境下的多张图像，所述多张图像中包括所述待识别对象在不同视角下的图像；确定立体深度图像模块，用于基于所述多张图像，确定所述待识别对象的立体深度图像；处理模块，用于基于所述立体深度图像，对所述待识别对象进行识别，得到识别结果。

在本公开一种实施方式中，所述确定图像模块采用以下方式基于多目近红外成像设备在暗光环境下对待识别对象拍摄得到的影像，确定所述待识别对象在暗光环境下的多张图像：基于至少两个多目近红外成像设备，在暗光环境下从多个不同视角拍摄待识别对象，得到对应所述多个不同视角的多张图像。

在本公开另一种实施方式中，所述确定图像模块采用以下方式基于多目近红外成像设备在暗光环境下对待识别对象拍摄得到的影像，确定所述待识别对象在暗光环境下的多张图像：基于一个或多个多目近红外成像设备，在暗光环境下拍摄待识别对象，得到一个或多个影像视频；在所述一个或多个影像视频中，提取包括所述待识别对象在多个不同视角的多张图像。

在本公开又一种实施方式中，所述确定立体深度图像模块采用以下方式基于所述多张图像，确定所述待识别对象的立体深度图像：在所述多张图像中确定第一图像，并确定所述第一图像中的多个不同位置；针对所述多个不同位置中的各位置，分别确定所述多张图像中在所述位置的视差以及深度信息；基于所述多个不同位置各自对应的视差以及深度信息，确定所述待识别对象的三维信息；基于所述三维信息，确定所述待识别对象的立体深度图像。

在本公开又一种实施方式中，所述处理模块采用以下方式基于所述立体深度图像，对所述待识别对象进行识别：调用基于立体深度图像预先训练的人工智能神经网络模型；基于所述人工智能神经网络模型，对所述待识别对象进行识别。

在本公开又一种实施方式中，所述处理模块还用于：基于所述待识别对象在设定时间内的多个识别结果，对所述待识别对象行为追踪。

根据本公开实施例的第三方面，提供一种对象识别装置，包括处理器；用于存储处理器可执行指令的存储器；其中，处理器被配置为用于调用指令执行本公开第一方面或第一方面任意实施方式中所述的对象识别方法。

根据本公开实施例的第四方面，提供一种非临时性计算机可读存储介质，当存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行本公开第一方面或第一方面任意实施方式中所述的对象识别方法。

本公开的实施例提供的技术方案可以包括以下有益效果：通过利用多目近红外成像设备能够在暗光环境下拍摄得到图像的特点，获取待识别对象在暗光环境下的多张不同视角的图像，并确定待识别对象的立体深度图像，基于立体深度图像，对待识别对象进行识别，进而实现在暗光环境下对待识别对象的识别。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1示出目前的一种对象识别方法的流程图。

图2是根据一示例性实施例示出的一种对象识别方法的流程图。

图3是根据一示例性实施例示出的一种确定待识别对象在暗光环境下的多张图像的流程图。

图4是根据一示例性实施例示出的一种基于多张图像，确定待识别对象的立体深度图像的流程图。

图5是根据一示例性实施例示出的一种基于立体深度图像，对待识别对象进行识别的流程图。

图6是根据一示例性实施例示出的另一种对象识别方法的流程图。

图7是根据一示例性实施例示出的又一种对象识别方法的流程图。

图8是根据一示例性实施例示出的一种对象识别装置的框图。

图9是根据一示例性实施例示出的一种用于对象识别的装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在附图中，自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。所描述的实施例是本公开一部分实施例，而不是全部的实施例。下面通过参考附图描述的实施例是示例性的，旨在用于解释本公开，而不能理解为对本公开的限制。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。下面结合附图对本公开的实施例进行详细说明。

图1示出目前的一种对象识别方法的流程图。

如图1所示，目前的一种对象识别方法可以包括步骤S11至步骤S14。

在步骤S11中，在强光条件下拍摄待识别对象。

在步骤S12中，基于3D立体深度成像设备获取3D立体深度图像。

在步骤S13中，基于人工智能神经网络解析3D立体深度图像。

在步骤S14中，输出对待识别对象的识别、追踪结果。

根据图1可知，在目前的对象识别方法中，往往利用结构光、飞行时间技术或双目立体成像技术形成关于待识别对象的立体深度图像，并结合人工智能神经网络技术对待识别对象的立体深度图像进行解析，以实现对待识别对象的识别和追踪。

但是，由于利用结构光、飞行时间技术或双目立体成像技术形成关于待识别对象的立体深度图像，往往过度依赖于强光条件。因此，目前的对象识别方法只能在强光环境下拍摄待识别对象，并对在强光环境下的待识别对象进行识别和追踪，进而无法实现在夜视或暗光环境下完成对待识别对象的识别和追踪。

近红外(Near Infrared，简称NIR)成像设备作为一种能够在夜视或暗光环境下产生更多光子的设备，可以在超出人类视觉能力的低光或无光情况下(又称在夜视或暗光环境下)拍摄到待识别对象。

本公开的实施例提供一种对象识别方法，通过利用多目近红外成像设备能够在暗光环境下拍摄得到图像的特点，获取待识别对象在暗光环境下的多张不同视角的图像，并确定待识别对象的立体深度图像，基于立体深度图像，对待识别对象进行识别。进而实现在暗光环境下对待识别对象的快速识别和追踪。

本公开将通过下述实施例对对象识别方法的过程进行说明。

本公开实施例提供的对象识别方法可以应用于夜视或暗光环境下对待识别对象的识别和追踪等。在一示例中，对象识别方法可以应用于安防领域，用以实现在夜视或暗光环境下对罪犯或犯罪行为的识别，并基于识别结果产生报警信号。在另一示例中，对象识别方法还可以应用于野外监控领域，用以实现在夜视或暗光环境下对野生动物的识别和追踪等。

图2是根据一示例性实施例示出的一种对象识别方法的流程图。

在本公开一示例性实施例中，如图2所示，对象识别方法可以包括步骤S21至步骤S23。下面将分别介绍各步骤。

在步骤S21中，基于多目近红外成像设备在暗光环境下对待识别对象拍摄得到的影像，确定待识别对象在暗光环境下的多张图像。其中，多张图像中包括待识别对象在不同视角下的图像。

在一种实施例中，待识别对象可以是安防领域中，在夜视或暗光环境下出现的罪犯或犯罪行为。待识别对象可以是在野外监控领域中，在夜视或暗光环境下出现野生动物。待识别对象还可以是其他在夜视或暗光环境下需要监控的人物、动物或行为。在本公开中，不对待识别对象作具体限定。

多目红外成像设备作为一种能够在夜视或暗光环境件下产生更多光子的设备，可以在超出人类视觉能力的低光或无光情况下(又称在夜视或暗光环境下)拍摄到待识别对象。在一种实施例中，可以基于多目近红外成像设备在暗光环境下对待识别对象拍摄得到的影像，确定待识别对象在暗光环境下的多张图像。在一示例中，可以基于多目近红外成像设备在暗光环境下从不同的位置对待识别对象进行拍摄，以得到待识别对象在不同视角下的多张图像。进而可以为基于待识别对象在不同视角下的多张图像，确定待识别对象的立体深度图像打下基础。

在另一种示例性实施例中，还可以采用以下方式基于多目近红外成像设备在暗光环境下对待识别对象拍摄得到的影像，确定待识别对象在暗光环境下的多张图像。

在一例中，可以基于至少两个多目近红外成像设备，在暗光环境下从多个不同视角拍摄待识别对象，得到对应多个不同视角的多张图像。在应用过程中，可以基于视差原理并利用至少两个多目近红外成像设备从不同的位置(又称不同视角)对待识别对象进行拍摄，用以获取待识别对象的多个不同视角的多张图像。进一步的，还可以通过计算多张图像中对应点间的位置偏差，来获取图像中待识别对象的三维几何信息。需要说明的是，多张图像中对应点间的位置偏差可以理解为图像中关于待识别对象中的相同位置点在不同视角下的位置偏差。

在步骤S22中，基于多张图像，确定待识别对象的立体深度图像。

在一种实施例中，可以基于待识别对象在不同视角下的多张图像，计算多张图像中对应点间的位置偏差，来获取图像中待识别对象的三维几何信息。进一步的，可以基于待识别对象的三维几何信息，确定待识别对象的立体深度图像。

在步骤S23中，基于立体深度图像，对待识别对象进行识别，得到识别结果。

在一种实施例中，可以基于待识别对象的立体深度图像，并结合人工智能神经网络技术，完成对待识别对象的识别，进而得到识别结果。

在又一种实施例中，可以在基于立体深度图像，对待识别对象进行识别，并得到识别结果后，基于识别结果产生相应的报警信息，用以提醒用户对待识别对象进行相应的处理。在一示例中，在安防领域中，可以基于在夜视或暗光环境下获取的关于人物A的立体深度图像，对人物A进行识别，并基于人工智能神经网络技术判断人物A是否为需要监控的罪犯或敏感人物。若判断出人物A为需要监控的罪犯或敏感人物，可以产生报警信息，用以提醒用户对人物A进行相应的处理。

在本公开实施例提供的对象识别方法中，通过利用多目近红外成像设备能够在暗光环境下拍摄得到图像的特点，获取待识别对象在暗光环境下的多张不同视角的图像，并确定待识别对象的立体深度图像，基于立体深度图像，对待识别对象进行识别。进而实现在暗光环境下对待识别对象的快速识别和追踪。

可以理解的是，待识别对象在暗光环境下的多张图像可以是直接基于多目近红外成像设备采集到的关于待识别对象的图像，也可以是基于多目近红外成像设备采集到一个或多个影像视频，并从影像视频中提取出的关于待识别对象在多个不同视角的多张视频帧图像。

本公开将通过下述实施例对一种基于多目近红外成像设备在暗光环境下对待识别对象拍摄得到的影像，确定待识别对象在暗光环境下的多张图像的过程进行说明。

图3是根据一示例性实施例示出的一种确定待识别对象在暗光环境下的多张图像的流程图。

在本公开一示例性实施例中，如图3所示，确定待识别对象在暗光环境下的多张图像包括步骤S31和步骤S32。

在步骤S31中，基于一个或多个多目近红外成像设备，在暗光环境下拍摄待识别对象，得到一个或多个影像视频。

在步骤S32中，在一个或多个影像视频中，提取包括待识别对象在多个不同视角的多张图像。

在一种实施例中，可以基于一个或多个影像视频，提取关于待识别对象在多个不同视角的多张视频帧图像，并将多张视频帧图像作为待识别对象在暗光环境下的多张图像。需要说明的是，关于待识别对象在多个不同视角的多张视频帧图像可以是由一个影像视频中提取出来，也可以是由多个影像视频中提取出来。

在另一种实施例中，待识别对象可以为在野外监控领域中，需要监控的野生动物A的行为。在应用过程中，可以基于一个或多个多目近红外成像设备，拍摄野生动物A在夜间的行动轨迹影像视频，并得到多个关于野生动物A在夜间的行动轨迹影像视频。在一例中，可以在一个或多个影像视频中，提取关于野生动物A在夜间环境下不同视角的多张视频帧图像。并基于多张视频帧图像，确定野生动物A的立体深度图像。进一步的，可以基于人工智能神经网络技术对野生动物A的立体深度图像进行解析，以确定野生动物A在夜间的行为特点。通过本实施例，可以在夜间环境下实现对待识别对象(野生动物A)的快速识别和追踪。

本公开将通过下述实施例对基于多张图像，确定待识别对象的立体深度图像的过程进行说明。

图4是根据一示例性实施例示出的一种基于多张图像，确定待识别对象的立体深度图像的流程图。

在本公开一示例性实施例中，如图4所示，确定待识别对象的立体深度图像包括步骤S41和步骤S44。下面将分别介绍各步骤。

在步骤S41中，在多张图像中确定第一图像，并确定第一图像中的多个不同位置。

在一种实施例中，可以在基于多目近红外成像设备拍摄得到的多张关于待识别对象的图像中，确定其中的一张图像作为第一图像。并确定第一图像中的多个不同位置。在一示例中，可以在第一图像中确定待识别对象的不同的位置点的位置信息。在一种实施例中，待识别对象为人物A，可以在第一图像中确定人物A中关于眼睛的位置点a、人物A中关于嘴巴的位置点b和人物A中关于鼻子的位置点c。

在步骤S42中，针对多个不同位置中的各位置，分别确定多张图像中在位置的视差以及深度信息。

继续以前文中描述的待识别对象为人物A为例进行说明。在一种实施例中，可以基于关于人物A的多张不同视角下的图像，分别确定人物A中关于眼睛的位置点a、人物A中关于嘴巴的位置点b和人物A中关于鼻子的位置点c的视差以及深度信息。

在步骤S43中，基于多个不同位置各自对应的视差以及深度信息，确定待识别对象的三维信息。

在一种实施例中，可以基于多个不同位置各自对应的视差以及深度信息，确定待识别对象的三维信息，为进一步确定待识别对象的立体深度信息打下基础。

继续以待识别对象为人物A为例进行说明，在一示例中，可以基于人物A中关于眼睛的位置点a、人物A中关于嘴巴的位置点b和人物A中关于鼻子的位置点c的视差以及深度信息，确定人物A的关于脸部的三维信息。进一步的，可以基于人物A的关于脸部的三维信息，确定人物A的关于脸部的立体深度图像。

在步骤S44中，基于三维信息，确定待识别对象的立体深度图像。

在一种实施例中，可以基于三维信息，确定待识别对象的立体深度图像。进一步的，基于待识别对象的立体深度图像，并结合人工智能神经网络技术，解析立体深度图像，并得到关于该立体深度图像的图像特征，为进一步结合图像特征分析待识别对象以及待识别对象的行为提供依据。

可以理解的是，若待识别对象不同，则基于待识别对象的立体深度图像，结合人工智能神经网络技术，对待识别对象进行识别过程中所需的人工智能神经网络模型有所不同。

本公开将通过下述实施例对基于立体深度图像，对待识别对象进行识别的过程进行说明。

图5是根据一示例性实施例示出的一种基于立体深度图像，对待识别对象进行识别的流程图。

在本公开一示例性实施例中，如图5所示，基于立体深度图像，对待识别对象进行识别可以包括步骤S51和步骤S52，下面将分别介绍各步骤。

在步骤S51中，调用基于立体深度图像预先训练的人工智能神经网络模型。

在步骤S52中，基于人工智能神经网络模型，对待识别对象进行识别。

在一种实施例中，可以预先训练出在对待识别对象进行识别过程中所需的人工智能神经网络模型。在一种实施例中，待识别对象为在安防领域中，夜间环境下关于地点N出现的人物以及人物的行为，对应该识别对象的人工智能神经网络模型为人工智能神经网络模型P。在另一种实施例中，待识别对象为在野外监控领域中，夜间环境下关于地点M出现的野外动物以及动物的行为，对应该识别对象的人工智能神经网络模型为人工智能神经网络模型Q。

在应用过程中，可以基于待识别对象的不同，调用基于待识别对象的立体深度图像预先训练的人工智能神经网络模型。可以理解的是，针对不同的待识别对象，调用不同的人工智能神经网络模型对待识别对象的立体深度图像进行解析和识别，可以提高对待识别对象进行识别和追踪的准确性。

本公开将通过下述实施例对另一种对象识别方法的过程进行说明。

图6是根据一示例性实施例示出的另一种对象识别方法的流程图。

在本公开一示例性实施例中，对象识别方法可以包括步骤S61至步骤S64，其中，步骤S61至步骤S63与前文所述的步骤S21至步骤S23相同，其具体描述和有益效果请参照前文，在本公开实施例中，不再赘述。下面将详细介绍步骤S64。

在步骤S64中，基于待识别对象在设定时间内的多个识别结果，对待识别对象行为追踪。

在一种实施例中，可以获取待识别对象在设定时间内的多个识别结果，并基于多个识别结果对待识别对象的行为进行追踪。在一示例中，待识别对象为在野外监控领域中，夜间环境下关于地点M出现的野外动物以及动物的行为。在应用过程中，可以基于多目近红外成像设备获取预设时间内的关于野外动物的多张不同视角下的图像。例如，可以分别获取在夜间22点、夜间22点15分、夜间22点30分，关于野外动物的多张不同视角下的图像，并得到相应的野外动物的立体深度图像。进一步的，基于立体深度图像，对野外动物进行识别，以得到在夜间22点、夜间22点15分、夜间22点30分，关于野外动物的多个识别结果。并基于多个识别结果，对野外动物的行为进行追踪。通过本实施例，可以实现在夜间环境下对野外动物的行为的追踪。

为了进一步解释对象识别方法，本公开将通过下述实施例对另一种对象识别方法的过程进行说明。

图7是根据一示例性实施例示出的又一种对象识别方法的流程图。

在本公开一示例性实施例中，如图7所示，对象识别方法可以包括步骤S71至步骤S74。下面将分别介绍各步骤。

在步骤S71中，在暗光环境下拍摄待识别对象。

在一种实施例中，可以基于多目近红外成像设备在暗光环境拍摄待识别对象，并获取待识别对象在不同视角下的多张图像。其中，待识别对象可以是安防领域中，在夜视或暗光环境下出现的罪犯或犯罪行为。待识别对象可以是在野外监控领域中，在夜视或暗光环境下出现野生动物。待识别对象还可以是其他在夜视或暗光环境下需要监控的人物、动物或行为。

在步骤S72中，基于多目近红外成像设备获取3D立体深度图像。

在一种实施例中，可以基于多目近红外成像设备获取待识别对象在不同视角下的多张图像，并计算多张图像中对应点间的位置偏差，来获取图像中待识别对象的三维几何信息。进一步的，可以基于待识别对象的三维几何信息，确定待识别对象的3D立体深度图像。

在步骤S73中，基于人工智能神经网络解析3D立体深度图像。

在一种实施例中，可以基于人工智能神经网络解析3D立体深度图像，完成对待识别对象的识别，进而得到识别结果。

在步骤S74中，输出对待识别对象的识别、追踪结果。

在一种实施例中，可以在基于3D立体深度图像，对待识别对象进行识别，并得到识别结果后，输出对待识别对象的识别、追踪结果。在又一实施例中，可以基于识别结果产生相应的报警信息，用以提醒用户对待识别对象进行相应的处理。在一示例中，在安防领域中，可以基于在夜视或暗光环境下获取的关于人物A的立体深度图像，对人物A进行识别，并基于人工智能神经网络判断人物A是否为需要监控的罪犯或敏感人物。若判断出人物A为需要监控的罪犯或敏感人物，可以产生报警信息，用以提醒用户对人物A进行相应的处理。

根据上述的描述可知，本公开的实施例提供的对象识别方法，通过利用多目近红外成像设备能够在暗光环境下拍摄得到图像的特点，获取待识别对象在暗光环境下的多张不同视角的图像，并确定待识别对象的立体深度图像，基于立体深度图像，对待识别对象进行识别。进而实现在暗光环境下对待识别对象的快速识别和追踪。

基于相同的构思，本公开实施例还提供一种对象识别装置。

可以理解的是，本公开实施例提供的对象识别装置为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。结合本公开实施例中所公开的各示例的单元及算法步骤，本公开实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同的方法来实现所描述的功能，但是这种实现不应认为超出本公开实施例的技术方案的范围。

图8是根据一示例性实施例示出的一种对象识别装置的框图。

在本公开一示例性实施例中，如图8可知，对象识别装置可以包括确定图像模块110、确定立体深度图像模块120和处理模块130。下面将分别介绍各模块。

确定图像模块110可以被配置为用于：基于多目近红外成像设备在暗光环境下对待识别对象拍摄得到的影像，确定待识别对象在暗光环境下的多张图像。其中，多张图像中包括待识别对象在不同视角下的图像。

确定立体深度图像模块120可以被配置为用于：基于多张图像，确定待识别对象的立体深度图像。

处理模块130可以被配置为用于：基于立体深度图像，对待识别对象进行识别，得到识别结果。

在本公开一示例性实施例中，确定图像模块110可以采用以下方式基于多目近红外成像设备在暗光环境下对待识别对象拍摄得到的影像，确定待识别对象在暗光环境下的多张图像：基于至少两个多目近红外成像设备，在暗光环境下从多个不同视角拍摄待识别对象，得到对应多个不同视角的多张图像。

在本公开一示例性实施例中，确定图像模块110可以采用以下方式基于多目近红外成像设备在暗光环境下对待识别对象拍摄得到的影像，确定待识别对象在暗光环境下的多张图像：基于一个或多个多目近红外成像设备，在暗光环境下拍摄待识别对象，得到一个或多个影像视频；在一个或多个影像视频中，提取包括待识别对象在多个不同视角的多张图像。

在本公开一示例性实施例中，确定立体深度图像模块120可以采用以下方式基于多张图像，确定待识别对象的立体深度图像：在多张图像中确定第一图像，并确定第一图像中的多个不同位置；针对多个不同位置中的各位置，分别确定多张图像中在位置的视差以及深度信息；基于多个不同位置各自对应的视差以及深度信息，确定待识别对象的三维信息；基于三维信息，确定待识别对象的立体深度图像。

在本公开一示例性实施例中，处理模块130可以采用以下方式基于立体深度图像，对待识别对象进行识别：调用基于立体深度图像预先训练的人工智能神经网络模型；基于人工智能神经网络模型，对待识别对象进行识别。

在本公开一示例性实施例中，处理模块130还可以被配置为用于：基于待识别对象在设定时间内的多个识别结果，对待识别对象行为追踪。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图9是根据一示例性实施例示出的一种用于对象识别的装置200的框图。例如，用于对象识别的装置200可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图9，用于对象识别的装置200可以包括以下一个或多个组件：处理组件202，存储器204，电力组件206，多媒体组件208，音频组件210，输入/输出(I/O)接口212，传感器组件214，以及通信组件216。

处理组件202通常控制用于对象识别的装置200的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件202可以包括一个或多个处理器220来执行指令，以完成上述的对象识别方法的全部或部分步骤。此外，处理组件202还可以包括一个或多个模块，便于处理组件202和其他组件之间的交互。例如，处理组件202还可以包括多媒体模块，以方便多媒体组件208和处理组件202之间的交互。

存储器204可以被配置为用于存储各种类型的数据以支持在用于对象识别的装置200的操作。这些数据的示例包括可以用于在用于对象识别的装置200上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器204可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电力组件206可以为用于对象识别的装置200的各种组件提供电力。电力组件206还可以包括电源管理系统，一个或多个电源，及其他与为用于对象识别的装置200生成、管理和分配电力相关联的组件。

多媒体组件208可以包括在所述用于对象识别的装置200和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板可以包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还可以检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件208可以包括一个前置摄像头和/或后置摄像头。当用于对象识别的装置200处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件210可以被配置为输出和/或输入音频信号。例如，音频组件210可以包括一个麦克风(MIC)，当用于对象识别的装置200处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风可以被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器204或经由通信组件216发送。在一些实施例中，音频组件210还可以包括一个扬声器，用于输出音频信号。

I/O接口212可以为处理组件202和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件214可以包括一个或多个传感器，用于为用于对象识别的装置200提供各个方面的状态评估。例如，传感器组件214可以检测到用于对象识别的装置200的打开/关闭状态，组件的相对定位，例如所述组件可以为用于对象识别的装置200的显示器和小键盘，传感器组件214还可以检测用于对象识别的装置200或用于对象识别的装置200一个组件的位置改变，用户与用于对象识别的装置200接触的存在或不存在，用于对象识别的装置200方位或加速/减速和用于对象识别的装置200的温度变化。传感器组件214可以包括接近传感器，可以被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件214还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件214还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件216可以被配置为便于用于对象识别的装置200和其他设备之间有线或无线方式的通信。用于对象识别的装置200可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件216可以经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件216还可以包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可以基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，用于对象识别的装置200还可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述的对象识别方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器204，上述指令可由用于对象识别的装置200的处理器220执行以完成上述的对象识别方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

可以理解的是，本公开中“多个”可以是指两个或两个以上，其它量词与之类似。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

进一步可以理解的是，术语“第一”、“第二”等可以用于描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开，并不表示特定的顺序或者重要程度。实际上，“第一”、“第二”等表述完全可以互换使用。例如，在不脱离本公开范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。

在附图中，自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。所描述的实施例是本公开一部分实施例，而不是全部的实施例。上文通过参考附图描述的实施例是示例性的，旨在用于解释本公开，而不能理解为对本公开的限制。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。上文结合附图对本公开的实施例进行了详细说明。

进一步可以理解的是，除非有特殊说明，“连接”可以包括两者之间不存在其他构件的直接连接，也可以包括两者之间存在其他元件的间接连接。

进一步可以理解的是，本公开实施例中尽管在附图中以特定的顺序描述操作，但是不应将其理解为要求按照所示的特定顺序或是串行顺序来执行这些操作，或是要求执行全部所示的操作以得到期望的结果。在特定环境中，多任务和并行处理可能是有利的。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 对象识别方法、对象识别装置及存储介质 [P] . 中国专利： CN112883791A . 2021-06-01
2. 对象识别方法、对象识别装置和电子设备 [P] . 中国专利： CN111435430A . 2020-07-21
3. Object recognition device, object recognition method, program for object recognition method, and recording medium having recorded thereon program for object recognition method [P] . 美国专利： US8160366B2 . 2012-04-17

机译：对象识别装置，对象识别方法，用于对象识别方法的程序以及其上记录有用于对象识别方法的程序的记录介质
4. OBJECT RECOGNITON DEVICE, OBJECT RECOGNITION METHOD, PROGRAM FOR OBJECT RECOGNITION METHOD, AND RECORDING MEDIUM HAVING RECORDED THERON PROGRAM FOR OBJECT RECOGNITION METHOD [P] . IN2009DE01042A . 2010-04-30

机译：对象识别装置，对象识别方法，用于对象识别方法的程序以及具有用于对象识别方法的已记录的赛隆程序的记录介质
5. Object recognition device, object recognition method, program for object recognition method, and recording medium having recorded thereon program for object recognition method [P] . 欧洲知识产权局专利： EP2136319A2 . 2009-12-23

机译：对象识别装置，对象识别方法，用于对象识别方法的程序以及其上记录有用于对象识别方法的程序的记录介质