公开/公告号CN112784630A
专利类型发明专利
公开/公告日2021-05-11
原文格式PDF
申请/专利权人 广东毓秀科技有限公司;
申请/专利号CN201911076650.3
申请日2019-11-06
分类号G06K9/00(20060101);G06K9/34(20060101);G06K9/46(20060101);G06K9/62(20060101);
代理机构
代理人
地址 510000 广东省广州市天河区金穗路3号1701房
入库时间 2023-06-19 10:57:17
技术领域
本发明涉及行人重识别技术领域,尤其是一种基于物理分割的局部特征进行行人重识别的方法。
背景技术
行人重识别(Person re-identification)也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题。给定一个监控行人图像,检索跨设备下的该行人图像。旨在弥补目前固定的摄像头的视觉局限,并可与行人检测/行人跟踪技术相结合,可广泛应用于智能视频监控、智能安保等领域。
目前应用比较广的包括姿态预估模型、人体骨骼关键点信息检测等。但需要指出的是:上述技术方案会在整个视频数据库中进行大数据匹配,在一些大画幅摄像头的信息中,显然包含了大量的空白信息。那么有必要对视频信息甚至在线的视觉信息进行物理分割。
发明内容
针对现有技术的不足,本发明提供一种基于物理分割的局部特征进行行人重识别的方法。
本发明的技术方案为:
一种基于物理分割的局部特征进行行人重识别的方法,其特征在于:包括以下步骤:
步骤一,指定视频中的目标,例如行人;
步骤二,根据目标所在区域进行视频的物理分割;
步骤三,根据目标的局部特征进行行人重识别。
具体的,所述步骤二中,所述视频的物理分割方法为静态分割或者交互分割。
所述的静态分割方法为:将视频导出,将视频包导入视频编辑软件,例如会声会影,通过编辑软件中的修剪滤镜得到小画幅视频。
所述的交互分割方法为:
(1)根据上一帧图像的分割结果,得到目标在上一帧图像中的轮廓线;
(2)将目标在上一帧图像中的轮廓线映射到当前帧图像,并对轮廓线上的每个像素点都匹配到该像素点在当前帧图像中的位置,得到目标在当前帧图像中的预估初始轮廓线;
(3)基于目标在当前帧图像中的预估初始轮廓线,通过距离映射得出每个像素点到预估初始轮廓线的最短距离,作为该像素点的位置属性;
(4)将当前帧图像中各像素由RGB颜色空间变换到YUV颜色空间,并在当前帧图像中各像素点的YUV颜色属性的基础上,加入各像素点的位置属性,以将各像素点属性的特征维数扩展到高维空间;
(5)将当前帧像素点到上一帧邻域像素点的平滑项根据上一帧像素点的标记折算为数据项,将折算后的数据项叠加到通过全局概率模型计算得到的数据项中,将叠加之后的数据项作为能量函数模型的数据项,得到能量函数模型;
(6)求解能量函数模型得到能量函数模型的解,并将当前帧图像作为上一帧图像,继续执行步骤(1)~步骤(5)直至视频分割结束。
具体的,所述根据目标的局部特征进行行人重识别的方法为:
步骤1:寻找与目标人物最相似的若干行人图像;
步骤1.1:训练图片输入ResNet-50网络,提取特征图,同时作为全局池化和水平池化两个分支的输入,提取局部特征,再降维,直至训练模型收敛。
步骤1.2:利用步骤1训练得到的模型,采用可信搜索路径优化,在一定范围内实现行人重识别。
步骤1.3:使用L2距离作为相似性度量,分别计算待查询图像与每一张候选图像之间的距离。
步骤1.4:使用概率分布函数Softmax将距离转换为概率分布,获得有效身份置信度。
步骤1.5:将上一阶段得到的图像的识别概率按照降序排列,考虑到每个范围内可能同一时间会识别出多个相似行人,可能是其他外貌比较相似的行人,故引入误判概率:有效身份数量和拍摄到相似行人的监控点数越多,则误判率越低。
步骤2:定位图像中行人的脸部;
步骤2.1:训练多尺度特征器,直至训练模型收敛。
步骤2.2:将行人重识别过程中得到的图片依次采用插值将其重新缩放到特定尺度,利用步骤1中得到的模型进行单张图片的人脸检测。
步骤2.3:利用步骤2.2中得到的人脸检测坐标对原图进行裁剪,得到每张图片的人脸部分图像。
步骤3:选取最具有辨识度的人脸图像;
步骤3.1:对图像进行像素范围的压缩,采用非线性预处理来减少动态范围。
步骤3.2:变换后的图像Ilog被分成M个小块,每一个小块Bi有n×n个像素,为了适应面部图像之间的对比度变化,将每个小块标准化,使其满足零均值和单位方差。
步骤3.3:对每一个小块Bi进行特征提取,再对每个小块提取一个2D的离散余弦变换 (DCT)特征向量,保留除首个直流分量外的前3个低频分量。
步骤3.4:对于每个小块Bi计算局部概率,利用定位概率模型计算每个小块对应特征向量xi的概率。
步骤3.5:计算给定人脸和理想人脸(一系列训练图片所表示的)相似的整体概率,由于各个小块相互独立,由M个小块组成的图像I的总概率为各小块概率之和。
步骤3.6:建立可信身份识别测度模型,确定目标人物的可辨识人脸。
本发明的有益效果为:先通过视频的物理分割,去除大量无效信息,减轻整个系统的计算工作量和节省时间,然后通过局部特征进行行人重识别,避免嫌疑人的换装、蒙面等恶意逃避行为对重识别的影响。
附图说明
图1为本发明的流程示意图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明:
实施例1
如图1所示,一种基于物理分割的局部特征进行行人重识别的方法,其特征在于:包括以下步骤:
步骤一,指定视频中的目标,例如行人;
步骤二,根据目标所在区域进行视频的物理分割;具体的,所述步骤二中,所述视频的物理分割方法为静态分割。
所述的静态分割方法为:将视频导出,将视频包导入视频编辑软件,例如会声会影,通过编辑软件中的修剪滤镜得到小画幅视频。
步骤三,根据目标的局部特征进行行人重识别。
具体的,所述根据目标的局部特征进行行人重识别的方法为:
步骤1:寻找与目标人物最相似的若干行人图像;
步骤1.1:训练图片输入ResNet-50网络,提取特征图,同时作为全局池化和水平池化两个分支的输入,提取局部特征,再降维,直至训练模型收敛。
步骤1.2:利用步骤1训练得到的模型,采用可信搜索路径优化,在一定范围内实现行人重识别。
步骤1.3:使用L2距离作为相似性度量,分别计算待查询图像与每一张候选图像之间的距离。
步骤1.4:使用概率分布函数Softmax将距离转换为概率分布,获得有效身份置信度。
步骤1.5:将上一阶段得到的图像的识别概率按照降序排列,考虑到每个范围内可能同一时间会识别出多个相似行人,可能是其他外貌比较相似的行人,故引入误判概率:有效身份数量和拍摄到相似行人的监控点数越多,则误判率越低。
步骤2:定位图像中行人的脸部;
步骤2.1:训练多尺度特征器,直至训练模型收敛。
步骤2.2:将行人重识别过程中得到的图片依次采用插值将其重新缩放到特定尺度,利用步骤1中得到的模型进行单张图片的人脸检测。
步骤2.3:利用步骤2.2中得到的人脸检测坐标对原图进行裁剪,得到每张图片的人脸部分图像。
步骤3:选取最具有辨识度的人脸图像;
步骤3.1:对图像进行像素范围的压缩,采用非线性预处理来减少动态范围。
步骤3.2:变换后的图像Ilog被分成M个小块,每一个小块Bi有n×n个像素,为了适应面部图像之间的对比度变化,将每个小块标准化,使其满足零均值和单位方差。
步骤3.3:对每一个小块Bi进行特征提取,再对每个小块提取一个2D的离散余弦变换 (DCT)特征向量,保留除首个直流分量外的前3个低频分量。
步骤3.4:对于每个小块Bi计算局部概率,利用定位概率模型计算每个小块对应特征向量xi的概率。
步骤3.5:计算给定人脸和理想人脸(一系列训练图片所表示的)相似的整体概率,由于各个小块相互独立,由M个小块组成的图像I的总概率为各小块概率之和。
步骤3.6:建立可信身份识别测度模型,确定目标人物的可辨识人脸。
实施例2
一种基于物理分割的局部特征进行行人重识别的方法,其特征在于:包括以下步骤:
步骤一,指定视频中的目标,例如行人;
步骤二,根据目标所在区域进行视频的物理分割;
步骤三,根据目标的局部特征进行行人重识别。
具体的,所述步骤二中,所述视频的物理分割方法为交互分割。
所述的交互分割方法为:
(1)根据上一帧图像的分割结果,得到目标在上一帧图像中的轮廓线;
(2)将目标在上一帧图像中的轮廓线映射到当前帧图像,并对轮廓线上的每个像素点都匹配到该像素点在当前帧图像中的位置,得到目标在当前帧图像中的预估初始轮廓线;
(3)基于目标在当前帧图像中的预估初始轮廓线,通过距离映射得出每个像素点到预估初始轮廓线的最短距离,作为该像素点的位置属性;
(4)将当前帧图像中各像素由RGB颜色空间变换到YUV颜色空间,并在当前帧图像中各像素点的YUV颜色属性的基础上,加入各像素点的位置属性,以将各像素点属性的特征维数扩展到高维空间;
(5)将当前帧像素点到上一帧邻域像素点的平滑项根据上一帧像素点的标记折算为数据项,将折算后的数据项叠加到通过全局概率模型计算得到的数据项中,将叠加之后的数据项作为能量函数模型的数据项,得到能量函数模型;
(6)求解能量函数模型得到能量函数模型的解,并将当前帧图像作为上一帧图像,继续执行步骤(1)~步骤(5)直至视频分割结束。
具体的,所述根据目标的局部特征进行行人重识别的方法为:
步骤1:寻找与目标人物最相似的若干行人图像;
步骤1.1:训练图片输入ResNet-50网络,提取特征图,同时作为全局池化和水平池化两个分支的输入,提取局部特征,再降维,直至训练模型收敛。
步骤1.2:利用步骤1训练得到的模型,采用可信搜索路径优化,在一定范围内实现行人重识别。
步骤1.3:使用L2距离作为相似性度量,分别计算待查询图像与每一张候选图像之间的距离。
步骤1.4:使用概率分布函数Softmax将距离转换为概率分布,获得有效身份置信度。
步骤1.5:将上一阶段得到的图像的识别概率按照降序排列,考虑到每个范围内可能同一时间会识别出多个相似行人,可能是其他外貌比较相似的行人,故引入误判概率:有效身份数量和拍摄到相似行人的监控点数越多,则误判率越低。
步骤2:定位图像中行人的脸部;
步骤2.1:训练多尺度特征器,直至训练模型收敛。
步骤2.2:将行人重识别过程中得到的图片依次采用插值将其重新缩放到特定尺度,利用步骤1中得到的模型进行单张图片的人脸检测。
步骤2.3:利用步骤2.2中得到的人脸检测坐标对原图进行裁剪,得到每张图片的人脸部分图像。
步骤3:选取最具有辨识度的人脸图像;
步骤3.1:对图像进行像素范围的压缩,采用非线性预处理来减少动态范围。
步骤3.2:变换后的图像Ilog被分成M个小块,每一个小块Bi有n×n个像素,为了适应面部图像之间的对比度变化,将每个小块标准化,使其满足零均值和单位方差。
步骤3.3:对每一个小块Bi进行特征提取,再对每个小块提取一个2D的离散余弦变换 (DCT)特征向量,保留除首个直流分量外的前3个低频分量。
步骤3.4:对于每个小块Bi计算局部概率,利用定位概率模型计算每个小块对应特征向量xi的概率。
步骤3.5:计算给定人脸和理想人脸(一系列训练图片所表示的)相似的整体概率,由于各个小块相互独立,由M个小块组成的图像I的总概率为各小块概率之和。
步骤3.6:建立可信身份识别测度模型,确定目标人物的可辨识人脸。
上述实施例和说明书中描述的只是说明本发明的原理和最佳实施例,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
机译: 一种使用来自摄像机的图像教人识别模型的方法以及从学习的模型中识别人以通过摄像机网络的第二个摄像机进行人识别的方法
机译: 基于人脸特征信息的能够进行人员认证的人脸识别装置及其人脸识别方法
机译: 一种基于电子识别标签的轮胎构造方法,该技术基于在UHF上运行的UHF射频中的射频识别标签技术进行识别。轮胎物联网的跟踪性和接口