首页> 中国专利> 一种基于支持向量机的出租车识别方法

一种基于支持向量机的出租车识别方法

摘要

本发明涉及车辆识别方法领域,尤其涉及一种基于支持向量机的出租车识别方法。该方法包括如下步骤:a、构建样本库;b、获取所述样本的判断窗口,提取归一化处理后的判断窗口的HOG特征,并利用此HOG特征训练支持向量机分类器;c、跟踪所输入的视频帧内的待识别车辆;d、将跟踪成功后的首个图像帧中跟踪窗口分别向上、下、左、四个方向移动若干像素点,获得四个子窗口;将归一化处理后的四个子窗口和跟踪窗口输入所述支持向量机分类器获得五个识别结果,由此获得空间域修正识别结果。其优点是采用时间域以及空间域上的多窗口投票机制来识别车辆是否为出租车。经过严格的实验证明,该出租车识别方法能够提高判断的准确率,具有较高的判断准确率与鲁棒性。

著录项

  • 公开/公告号CN102902983A

    专利类型发明专利

  • 公开/公告日2013-01-30

    原文格式PDF

  • 申请/专利权人 博康智能网络科技股份有限公司;

    申请/专利号CN201210356432.7

  • 发明设计人 田广;梁龙飞;叶飞;张重阳;

    申请日2012-09-21

  • 分类号G06K9/62(20060101);G06K9/46(20060101);

  • 代理机构31263 上海胜康律师事务所;

  • 代理人张坚

  • 地址 201209 上海市浦东新区川沙路955号11幢221室

  • 入库时间 2024-02-19 17:18:13

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-11-09

    专利权人的姓名或者名称、地址的变更 IPC(主分类):G06K9/62 变更前: 变更后: 申请日:20120921

    专利权人的姓名或者名称、地址的变更

  • 2016-01-20

    授权

    授权

  • 2013-03-13

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20120921

    实质审查的生效

  • 2013-01-30

    公开

    公开

说明书

技术领域

本发明涉及基于视频图像的车辆识别方法领域,尤其涉及一种基于支持向 量机的出租车识别方法。

背景技术

目前智能交通系统中对交通监控系统的鲁棒性和可靠性的要求越来越高, 由于基于地感线圈、超声波和雷达等传感器的车辆检测方法无法识别车辆类型, 因此基于视频图像的车辆检测和识别技术成为交通监控中的一项重要研究课 题,它在计算机视觉导航,交通监视领域有着重要的实用价值,为城市复杂交 通网络的智能化和科学化管理提供自动化和科学的支持。目前,基于视频图像 的车辆识别方法主要有HAAR-LIKE矩形特征算法、边缘检测法以及基于梯度 方向直方图[2](Histogram of Oriented Gradient,简称HOG)等方法,以下对于 上述三种识别算法进行简要描述:

一、HAAR-LIKE矩形特征算法

最早的HAAR-LIKE矩形特征库是Papageorgiou C.等提出,Viola P.等的 快速人脸识别系统采用了3种类型5种形式的矩形特征,分别为:2矩形特征、 3矩形特征和4矩形特征。其特征值的定义为黑色矩形内所有像素值的和减去 白色矩形内所有像素值的和。

L ienhart R.等对HAAR-LIKE矩形特征库作了进一步扩展,加入旋转45 度角的矩形特征。扩展后的特征大致分为4种类型:边缘特征、线特征环、中 心环绕特征和对角线特征。如图1所示。

用HAAR-LIKE矩形特征来表述车辆,是因为这种特征表示的形式简单, 计算速度快,形式多样,这些矩形特征可派生出丰富的矩形特征。

二、边缘检测法

边缘检测方法是在不同的光线条件下利用车体的不同部件、颜色等提供的 边缘信息有效的提取车辆的边缘,从而进行静止和运动车辆的检测。相对于背 景消减法,由于车辆的表面、形状及颜色不同,边缘检测法所能提供的信息相当 显著。即便车辆与路面的颜色相同,因为车辆要比地面反射更多的光线所以车 辆仍能被检测出来。

三、基于梯度方向直方图(Histogram of Oriented Gradient,简称HOG)算 法

HOG算法最重要的思想是:在一副图像中,局部目标的表象和形状 (appearance and shape)能够被梯度或边缘的方向密度分布很好地描述。具 体的实现方法是:首先将图像分成小的连通区域,我们把它叫细胞单元。然后 采集细胞单元中各像素点的梯度的或边缘的方向直方图。最后把这些直方图组 合起来就可以构成特征描述器。为了提高性能,我们还可以把这些局部直方图 在图像的更大的范围内(我们把它叫区间或block)进行对比度归一化 (contrast-normalized),所采用的方法是:先计算各直方图在这个区间(block) 中的密度,然后根据这个密度对区间中的各个细胞单元做归一化。通过这个归 一化后,能对光照变化和阴影获得更好的效果。

以上所描述的这些技术均已比较成熟,然后在其实际的应用中往往鲁棒性 和可靠上面临着诸多挑战.主要表现为:

(1)车载摄像头实时拍行驶辆,使得拍摄到的物体尺寸和形态是不断变化, 并且经常会发生车辆重叠现象;

(2)车辆外观多种多样,包括形状、颜色和尺寸等的多样化,在不同的视角 和光照下,车辆外观存在很大区别;

(3)不同的天气状况引起的光照条件、阴天与雨雪等对视觉系统有很大影 响;引起的光照条件、阴天与雨雪等对视觉系统有很大影响;

(4)复杂的外界环境如景物阴影、难以预测交通流干扰和混乱背复杂的外界 环境等的影响,所有这些都是难以控制和预测。

而且,现有技术中基于视频图像的车辆检测和识别技术主要集中在车牌识 别和车型粗分类(将检测到的车辆分类为小型车、中型车和大型车等)。由于出 租车占交通系统中相当大比例,识别车辆是否是出租车在交通监控具有重要的 意义,而目前尚无一种专门用于分辨机动车是否为出租车的识别技术。

发明内容

本发明实施例的目的是针对现有技术的空白,提出一种基于支持向量机的 出租车识别方法,经过严格的实验证明,该出租车识别方法具有较高的判断准 确率与鲁棒性。

为了达到上述发明目的,本发明提出的一种基于支持向量机的出租车识别 方法是通过以下技术方案实现的:

一种基于支持向量机的出租车识别方法,其特征在于包括如下步骤:

a、构建样本库,包括含有出租车辆的正样本以及含有其它机动车辆的负样 本;

b、获取所述样本的判断窗口,并将所述判断窗口图像尺寸归一化;提取归 一化处理后的判断窗口的HOG特征,并利用此HOG特征训练支持向量机分类 器;

c、跟踪所输入的视频帧内的待识别车辆;

d、将跟踪成功后的首个图像帧中跟踪窗口分别向上、下两个方向移动y 个像素点,获得二个子窗口,以及向左、两个方向移动x个像素点,获得另二 个子窗口;将所获得的四个子窗口尺寸归一化,将归一化处理后的四个子窗口 和跟踪窗口输入所述支持向量机分类器获得五个识别结果,对这五个识别结果 进行投票统计,票数多者取胜,由此获得空间域修正识别结果;

所述的x、y均为正整数。

在具体实施例中,该识别方法还包括时间域修正步骤:由所述首个图像帧 起,对一段时间内的连续视频帧中采样获得n个关键帧,并分别对所述关键帧 执行步骤d,以获得多个空间域修正识别结果,将基于这些关键帧和首个图像 帧做出的空间域修正识别结果进行投票统计,票数多者取胜,由此获得时间域 修正识别结果,其中n为大于2的自然数。

在具体实施例中,所述关键帧是以固定时间间隔在所述一段时间内的连续 视频帧选取的。

在具体实施例中,所述n为4,所述固定时间间隔取决于对任一所述关键 帧执行步骤e的时间。

在具体实施例中,该识别方法还包括如下步骤:周期性的对所述连续视频 帧执行所述步骤d以及所述时间域修正步骤,以获得基于同一跟踪窗口的多个 空间域修正识别结果,并在每获得一个空间域修正识别结果之后,对于之前基 于同一跟踪窗口做出的识别结果进行修正。

在具体实施例中,所述样本的判断窗口、所述子窗口和所述跟踪窗口均被 归一化为横向a个像素点、纵向b个像素点,所述a、b均为大于10的自然数; 且所述x取值范围为0.1a-0.2a,所述y取值范围为0.1b-0.2b。

在具体实施例中,所述样本库中的样本为监控摄像机所采集的车辆图像经 过大小归一化处理后获得。

在具体实施例中,所述监控摄像机选自其内出租车具有相同规范的地区。

与现有技术相比,本发明一种基于支持向量机的出租车识别方法通过HOG 算法提取图片帧中的HOG特征,并利用此HOG特征训练支持向量机分类器; 之后采用时间域以及空间域上的多窗口投票机制来识别车辆是否为出租车。经 过严格的实验证明,该出租车识别方法能够提高判断的准确率,具有较高的判 断准确率与鲁棒性。

附图说明

通过下面结合附图对其示例性实施例进行的描述,本发明上述特征和优点 将会变得更加清楚和容易理解。

图1为HAAR-LIKE矩形特征算法各特征示意图;

图2为本发明实施例流程示意图;

图3为本发明实施例HOG算法流程示意图;

图4为本发明实施例多窗口投票机制的原理示意图。

具体实施方式

下面结合附图对本发明作进一步详细说明,以便于同行业技术人员的理解:

相对于其它机动车来说,出租车具有以下显著特点:

特点一、顶灯。出租车的顶灯为区别于其他车辆的明显标志。对车身的轮 廓特征有明显的改变。

特点二、车型。出租车为小轿车车型,在外形轮廓方面明显区别于中大型 的车辆。

参见图2-4,本实施例提供的一种基于支持向量机的出租车识别方法,该 出租车识别方法的实现正是依靠出租车相对于其他车辆所具有显著的轮廓特 征。针对上述的轮廓特征,该出租车识别方法使用HOG算法提取车辆轮廓信 息,并以支持向量机(Support Vector Machine、SVM)训练分类器,最终实 现对出租车的识别。

参见图1,其为出租车识别方法的总体设计流程,其主要设计思路和常规 的车辆识别方法相同,首先构件出租车分类器,之后通过分类器对于出租车进 行识别,以下将对这两个步骤进行详细描述:

一、构建出租车分类器,由下述几个步骤组成:

1.1、构建样本库,包括含有出租车的正样本以及含有其它机动车辆的负样 本。在算法一定的情况下,样本库的大小和典型性共同决定着SVM分类器的 准确性。而由于一个地区的出租车往往和其它地区出租车体现出较大的差异性, 包括一些车辆轮廓特征影响较大的因素,如车顶灯的外形尺寸、车顶灯在夜间 发光状态下的外形轮廓等。因此优选的,构建样本库应该基于同一个地区内的 多个监控摄像机所采集的车辆图像(注:此处所用术语“地区”应当被理解为 其内的出租车具有相同规范的地域,在实际实践中应根据不同区域交管部门的 具体要求对于上述地区进行选择)。虽然采用这样的样本库所训练的SVM分类 器不可避免的具有一定地域性,不太适宜其它地区使用,但是准确度会相应提 高。相反的,如果采用多个地区的监控摄像机所采集的车辆图像,SVM分类器 会具有普适性,但是其准确率往往会有一定程度的下降。

不仅如此,所采集的车辆图像的选择还需要具有全面型、典型性,样本库 应该包含了各种车型在各种天气情况以及各种光照环境下各种角度的图像。基 于这样的样本库,使得SVM分类器的准确性得到了保证。

1.2、基于HOG算法提取所述上述经归一化处理后的判断窗口的HOG特 征,并利用此HOG特征训练SVM分类器。以下对于HOG算法以及SVM分 类器进行简要描述:

HOG算法能在低清晰度的情况下较为准确的对车辆的轮廓特征进行提取。 是因为HOG算法是在局部细胞单元上提取颜色梯度,对清晰度要求不高。从 而降低了对仪器的要求,极大的降低了成本。

针对车辆识别中普遍存在的问题,即不同光照下车辆的外观的不同。由于 HOG方法是在图像的局部细胞单元上操作,所以它对图像几何的(geometric) 和光学的(photometric)形变都能保持很好的不变性。从而增加了识别的鲁棒 性。

HOG特征是一种局部区域描述符,它通过计算局部区域上的梯度方向直方 图来构成车辆外型特征,能够很好地描述车辆的边缘。它对光照变化和小量的偏 移不敏感。输入图像中像素点(x,y)的梯度如以下公式

Gx(x,y)=H(x+1,y)-H(x-1,y)

Gy(x,y)=H(x,y+1)-H(x,y-1)

式中,Gx(x,y)、Gy(x,y)、H(x,y)分别表示输入图像中像素点(x,y)处的水平方 向梯度、垂直方向梯度和像素值。像素点(x,y)处的梯度幅值和梯度方向如以下 公式

G(x,y)=|Gx(x,y)2+Gv(x,y)2

α(x,y)=tan-1(Gy(x,y)Gx(x,y))

HOG特征提取步骤:把图像分割为若干个8×8像素的单元(cell),把[-π /2,π/2]的梯度方向平均划分为9个区间(bin),在每个cell内对所有像素的梯 度幅值在各个方向bin区间进行直方图统计,如下图1.7所示,得到一个9维 的特征向量,每相邻4个单元为一个块(block),把4个单元的特征向量联起来 得到块的36维特征向量,用block对样本图像进行扫描,扫描步长为一个cell, 最后将所有block的特征串联得到车辆的特征。在DATAL的方法中所有块的大 小是固定的,获得的信息有限,不能获得较为完整的信息,本发明实施例中采 用大小可变的block提取HOG特征,采用的block的宽高比分别为(1:1)、(2: 1)、(1:2)。block的大小变化从16×16到64×128,每个block平均分为4 个cell单元。每个block的移动步长仍为8个像素,这样总共得到438个block, 每个block内HOG特征使用以下公式进行归一化。

V=v||v||+ϵ

式中,v为待归一化向量;ε用来避免分母为0,本实施例中取ε=0.05。为 了提高计算速度,在计算HOG特征时引入积分向量图,先用9个积分直方图 来分别表示各像素点在9个梯度方向的梯度积分图,这样在对梯度方向离散化 时就不能用三角线性投票方式。利用积分图对任何一个矩形区域内的直方图统 计用4个角的积分值可快速计算得到,这样避免了由于block的重叠造成的重 复计算,提高了计算速度。

与其他的特征描述方法相比,HOG算法有很多优点。首先,由于HOG方 法是在图像的局部细胞单元上操作,所以它对图像几何的(geometric)和光学 的(photometric)形变都能保持很好的不变性,而这两种形变只会出现在更大 的空间领域上。

SVM的主要思想可以概括为两点:(1)它是针对线性可分情况进行分析, 对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分 的样本转化为高维特征空间使其线性可分,从而使得高维特征空间采用线性算 法对样本的非线性特征进行线性分析成为可能;(2)它基于结构风险最小化理论 之上在特征空间中建构最优分割超平面,使得学习其得到全局最优化,并且在 整个样本空间的期望风险以某个概率满足一定上界。

基于上述原理,本实施例中将判断窗口进行归一化处理,再送进HOG算 法中进行变换,将一个100×100的图片,从10000维降阶到900维。通过 HOG算法的变化,经过特征提取后的图像特征,凸显了出租车顶灯的轮廓特征。 之后将HOG算法提取的图像特征,送入SVM进行训练。得到SVM构造的车 辆分类器。

二、出租车识别,出租车识别是建立在车辆跟踪的基础上的,通过对驶入 监控区域的所有车辆进行跟踪,只需对跟踪好的目标窗口进行各种识别判断即 可。由于车辆跟踪技术为本领域技术人员习见技术,故在此对其具体原理不再 赘述。出租车识别是采用上述SVM分类器对于所输入的一段含有待识别车辆 的连续图像帧进行识别。事实上,随样本库中样本量的增长,SVM分类器的判 断正确率的增加速度会逐步减慢,因此为进一步提高判断正确率,本申请人在 本发明中提出了采用时间域以及空间域上的多窗口投票机制。

空间域

在本申请人的反复实验中发现,即使在相同的SVM分类器下,基于同一 张图像帧,由于标准跟踪窗口的选择不同也会造成判断车辆背景的改变,因此 在一定条件下能够导致判断结果发生变化。而在申请人将标准跟踪窗口多次进 行微小的移动后发现,平移标准跟踪窗口所获得的多个子窗口的大部分是有利 于判断的,而少量则由于特殊背景会导致判断错误。换而言之,标准跟踪窗口 同样会存在由于特殊背景而导致错误判断。基于上述原理论,空间域上的多窗 口投票机制的基本原理如下:

将一张图像帧中的标准跟踪窗口分别向上、下两个方向移动x个像素点, 获得二个子窗口,以及向左、两个方向移动相同的y个像素点,获得另二个子 窗口。将所获得的这4个子窗口尺寸归一化,将经归一化处理后的4个子窗口 和标准跟踪窗口输入所述支持向量机分类器获得五个识别结果。承上述,基于 同一张图像帧的5个识别结果大部分是在利于判断的基础上得出的,也就是说 是正确的结果。对这五个识别结果进行投票统计,是、否两种结果中票数多者 取胜,由此获得第一次修正识别结果。

时间域

在车辆运行的过程中,难免存在受到遮挡、车辆背景复杂、反光等不利于 判断识别的因素,从而导致误判。但是本申请人通过对大量视频的调研发现, 在车辆运行的连续的一段时间内,其大部分的时间中是有利于判断的。正是基 于上述理论,时间域上的多窗口投票机制的基本原理如下:

在一段连续的图像帧(含有待识别车辆),选取多张图像帧。基于“在车辆 连续运行中,大部分的时间有利于判断”的理论,将这些图像帧中包括同一待 待识别出租车辆完整图像的跟踪窗口分别输入SVM分类器中获得多个识别结 果后,这些识别结果大部分是在利于判断的基础上得出的,也就是说是正确的 结果。在对于这些结果加权并进行投票统计,是、否两种结果中票数多者获胜, 由此得到修正后的判断结果。而通过时间域上的多窗口投票机制,可很好的规 避由于特殊条件下所获得错误识别结构的偶然性,有效的增加了判断的鲁棒性。

事实上,将空间域和时间域多窗口投票机制结合,还可以进一步提高判断 的鲁棒性。以及这样的设计思路,本实施例中车辆识别步骤的具体实施方式如 下:

2.1、对所输入的一段含有待识别车辆的连续视频帧进行车辆跟踪处理,当 跟踪处理完毕时,跟踪成功后的首个图像帧起对于视频帧采样获得关键帧(关 键帧的采样率取决于一帧图像的处理速度)。在本实施例中该步骤为在一秒内每 隔0.2秒取1帧图像帧,将所得的5帧图像(包括所述首个图像帧)的每一帧 使用空间域的算法得出各自帧的空间域修正结果,之后将这一秒内的5帧图像 的空间域修正结果进行投票,即时间域处理,完成对最初判断结果的时空域联 合修正。需要注意的是,上述0.2秒和1秒仅为示例性的举例,实际中的时间 间隔的选取应该在满足完成一帧图像的处理周期的基础上,车辆产生较为明显 的位移。而进行时间域处理的视频帧数量不宜过少,否则具有相对较高的错误 率,而且也不宜较多,否则运算量过大。

在步骤2.1中,空间域投票中窗口平移量x和y的取值如下:设标准判断 跟踪窗口为横向a个像素点、纵向b个像素点,x取值范围为0.1a-0.2a,y 取值范围为0.1b-0.2b。

上述x和y的取值范围是本申请人经过大量实际试验所获得的经验值,如 果平移因子过大,自窗口将可能不能很好的涵盖目标,如果平移因子过小,则 平移效果不够。

2.2、后续帧的间隔修正识别

当上述首次识别步骤完成后,已经获得车辆识别结果。而在此车辆进入监 控区域的一段时间内不再需要时刻对其进行识别,这样在大车流量慢车速的情 况下可以减少运算量。为增加判断准确率与鲁棒性,在后续视频帧中采用间隔 识别修正的方式。

也就是说,对于同一辆机动车辆,从进入监控区域并跟踪成功后的首次识 别完成起,每隔一定周期对此车辆进行一次修正识别,重复上述步骤2.1,以 对于前次判断结果进行修正。

以上通过实施例详细描述了本发明所提出的识别方法的具体实施步骤,以 下通过实验对于本实施例提出的识别方法和现有的基于HOG算法和SVM分类 器的识别方法进行对比:

实验设计

在测试样本库随机取出正负测试样本各30张,在样本库随机挑选正负样 本各150,250,350,500张。分别用现有识别方法与本实施例识别方法进行 识别,并对检测结果进行对比评估,获得下表。

原算法与加入多角度判断算法的正确率对比结果

本发明所属领域的一般技术人员可以理解,本发明以上实施例仅为本发明 的示意性实施例之一,为篇幅限制,这里不能逐一列举所有实施方式,任何可 以体现本发明权利要求技术方案的实施,都在本发明的保护范围内。

需要注意的是,以上内容是结合具体的实施方式对本发明所作的进一步详 细说明,不能认定本发明的具体实施方式仅限于此,在上述实施例的指导下, 本领域技术人员可以在上述实施例的基础上进行各种改进和变形,而这些改进 或者变形落在本发明的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号