首页> 中国专利> 用于识别对象及另一低级别对象的模式识别装置及其方法

用于识别对象及另一低级别对象的模式识别装置及其方法

摘要

在模式识别装置中,特征量计算单元计算如下的特征量,该特征量用于从输入模式中剪取的部分图像中识别期望的对象,似然性计算单元通过参照对象字典,根据由特征量计算单元计算出的特征量,来计算作为识别目标的对象的似然性,并且,对象确定单元基于由似然性计算单元计算出的对象的似然性,来确定该部分图像是否是作为识别目标的对象。似然性计算单元通过参照特定对象字典,根据由特征量计算单元计算出的特征量,来计算作为识别目标的对象的似然性。对象确定单元基于由似然性计算单元计算出的对象的似然性,来确定该部分图像是否是作为识别目标的特定对象。

著录项

  • 公开/公告号CN102422325A

    专利类型发明专利

  • 公开/公告日2012-04-18

    原文格式PDF

  • 申请/专利权人 佳能株式会社;

    申请/专利号CN201080021092.1

  • 发明设计人 矢野光太郎;

    申请日2010-05-06

  • 分类号G06T7/00(20060101);G06T1/00(20060101);

  • 代理机构11293 北京怡丰知识产权代理有限公司;

  • 代理人迟军

  • 地址 日本东京都

  • 入库时间 2023-12-18 04:59:56

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-06-24

    授权

    授权

  • 2012-05-30

    实质审查的生效 IPC(主分类):G06T7/00 申请日:20100506

    实质审查的生效

  • 2012-04-18

    公开

    公开

说明书

技术领域

本发明涉及一种模式识别装置及其方法,所述模式识别装置及其方 法被配置为基于输入模式来识别预定对象,并且进一步识别级别比该预 定对象的级别低的特定对象。

背景技术

在检测人物的面部时,可以利用基于图像来检测特定对象模式的图 像处理方法。因此,能够在诸如电信会议、人机接口、安全系统和跟踪 人物的面部的监视系统等的各种场合和技术领域,来使用该图像处理方 法。

为了检测图像中的人物的面部,例如,可以使用在Yang et al, ″Detecting Faces in Images:A Survey″,IEEE TRANSACTIONS ON  PATTERN ANALYSIS AND MACHINE INTELLIGENCE,VOL.24,NO.1, JANUARY 2002中讨论的方法。这种方法基于几个显著特征(例如人物 的面部的眼睛、嘴和鼻子)以及这些特征之间的几何位置关系,来检测 人物的面部。

另外,Yang et al,″Detecting Faces in Images:A Survey″,IEEE  TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE  INTELLIGENCE,VOL.24,NO.1,JANUARY 2002讨论了如下的方法,即 基于人物的面部的对称特征和人物的面部的颜色的特征,利用模板匹配 方法和神经网络方法,来检测人物的面部。

近年来,期望有如下的方法,即除了简单地检测人物的面部之外, 还能够基于检测到的人物的面部来区分并识别特定人物。更具体地说, 如果能够从拍摄的多个人物的图像中区分并识别特定人物,则用于识别 使用照相机在图像中拍摄的人物的面部、并且被配置为根据识别出的面 部执行适当的曝光和聚焦控制的应用,能够执行适合于特定人物的控制。

然而,当前无法容易地实现对人物的面部和特定人物的面部的识别。 更具体地说,日本专利申请特开第2007-115109号公报讨论了如下方法, 即基于人物的肤色的特征来识别人物的面部,获取识别出的面部的关注 区域,并且基于用作特征量的所获取的关注区域的位置来识别特定人物 的面部。

这种方法分开执行对人物的面部的识别和对特定人物的面部的识 别。如果简单地组合使用识别图像中的特定人物的面部的处理,则需要 在各个处理中计算特征量并且执行面部识别。因此,在这种情况下,需 要执行复杂的处理。

通常,不仅在组合执行面部识别和对特定人物的面部的识别时,而 且在组合执行对高级别的对象和低级别的另一对象的识别时,都出现上 述问题。

换句话说,期望面部识别应用能够在识别诸如人物的面部的高级别 对象之后,识别诸如特定人物的面部的低级别对象。

此外,对于通过从大量图像之中识别动物的图像来搜索动物的图像 的应用,期望搜索属于比动物图像的类别低的类别的狗的图像。另外, 对于识别并强调在运行车辆的场景的视频中拍摄的交通标志和指示牌的 车辆导航应用,期望区分并强调特定指示牌。

[引用文献列表]

[专利文献]

[PTL 1]

日本专利申请特开第2007-115109号公报

[非专利文献]

[NPL 1]

Yang et al,″Detecting Faces in Images:A Survey″,IEEE  TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE  INTELLIGENCE,VOL.24,NO.1,JANUARY 2002

[NPL 2]

Viola and Jones,″Rapid Object Detection using Boosted Cascade of  Simple Features″,Proceedings of the IEEE Conference on Computer Vision  and Pattern Recognition(CVPR′01)

发明内容

本发明旨在提供一种能够使用简单的配置来实现对高级别类别对象 的识别和对属于低级别类别的特定对象的识别的模式识别装置。

根据本发明的一方面,提供了一种模式识别装置,该模式识别装置 包括:特征量计算单元,被配置为计算输入模式的特征量;基于预定对 象的特征量的分布而生成的对象字典;基于所述预定对象中的特定对象 的特征量的分布而生成的特定对象字典;第一似然性计算单元,被配置 为通过参照所述对象字典,基于由所述特征量计算单元计算出的特征量, 来对于所述输入模式是否是所述预定对象的计算第一似然性;第一对象 确定单元,被配置为基于所述第一似然性,来确定所述输入模式是否是 所述预定对象的;第二似然性计算单元,被配置为如果所述第一对象确 定单元确定所述输入模式是所述预定对象的,则通过参照所述特定对象 字典,基于由所述特征量计算单元计算出的所述特征量,来对于所述输 入模式是否是所述特定对象的计算第二似然性;以及第二对象确定单元, 被配置为基于所述第二似然性,来确定所述输入模式是否是所述特定对 象的。

从以下参照附图对示例性实施例的详细描述,本发明的其它特征和 方面将变得清楚。

附图说明

包含在说明书中、构成说明书的一部分的附图,示出了本发明的示 例性实施例、特征和方面,并且与文字说明一起,用于解释本发明的原 理。

图1示出了模式识别装置的示例性配置。

图2是示出识别预定对象的方法的示例性处理流的流程图。

图3示出了在图像中搜索面部模式的方法的示例。

图4示出了人物的面部的特征量的示例。

图5示出了用于计算对象的似然性的参照表的示例。

图6示出了识别结果的输出的示例。

图7是示出执行用于识别特定对象的设置的方法的示例性处理流的 流程图。

图8示出了用于计算特定对象的似然性的参照表的示例。

图9是示出识别特定对象的方法的示例性处理流的流程图。

图10示出了人物的面部和特定人物的面部的识别结果的输出的示 例。

图11示出了模式识别装置的配置的另一示例。

具体实施方式

下面,将参照附图详细描述本发明的各种示例性实施例、特征和方 面。

图1是示出根据本发明的示例性实施例的模式识别装置的示例性配 置的框图。

参照图1,模式识别装置包括图像输入单元10、模式提取单元20、 特征量计算单元30、似然性计算单元40、对象确定单元50、识别结果输 出单元60、对象字典100、特定对象字典110和字典生成单元200。

图像输入单元10获取由照相机的摄像单元(未示出)拍摄的图像的 数据。模式提取单元20从由图像输入单元10获取的图像数据中,剪取 要进行模式识别的部分图像。

特征量计算单元30计算如下的特征量,该特征量用来从由模式提取 单元20剪取的部分图像中识别期望的对象。似然性计算单元40基于由 特征量计算单元30计算的特征量,计算作为识别目标的对象的似然性。

对象确定单元50基于由40计算的对象的似然性,来确定由模式提 取单元20剪取的部分图像是否是要识别的对象。

识别结果输出单元60输出由对象确定单元50进行的识别的结果。 更具体地说,如果对象确定单元50确定识别出的对象是期望的对象,则 识别结果输出单元60以能够将部分图像区域与其它图像区域区分开来的 方式,在模式识别装置的显示器上显示部分图像的区域。

对象字典100和特定对象字典110存储似然性计算单元40在计算似 然性时使用的期望的识别目标对象的特征。可以基于多个对象的模式, 通过机器学习事先生成对象字典100。

字典生成单元200生成用来基于由特征量计算单元30计算的特征量 来识别特定对象的特定对象字典110。由模式识别装置的控制单元(未示 出)控制这些单元中的各个的操作。

现在,将在下面详细描述具有上述配置的模式识别装置的操作。模 式识别装置执行以下操作:

(1)使用事先存储的对象字典对预定对象的识别;

(2)用于执行对属于低级别类别的特定对象的识别的设置;以及

(3)对属于低级别类别的特定对象的识别。

现在,将在下面详细描述上述项目操作(1),即对预定对象的识别。

图2是示出使用事先存储的对象字典来识别预定对象的方法的示例 性处理流的流程图。在本示例性实施例中,将描述识别图像中的人物的 面部的方法。

参照图2,在步骤S101中,图像输入单元10获取由摄像单元(未示 出)拍摄的图像的数据。图像数据包括包含8位像素的二维排列的数据。 图像数据包括红色(R)、绿色(G)和蓝色(B)(RGB)图像平面。

更具体地说,图像输入单元10将RGB图像数据转换为亮度图像数 据。将亮度图像数据存储在图像存储器(未示出)上,并在后续处理中 使用。如果获取了YUV图像数据作为图像数据,则也可以将Y分量按 原样用作亮度数据。

在步骤S102中,模式提取单元20从图像存储器加载在步骤S101中 获取的图像数据,并且从图像数据中剪取作为对象识别的目标区域的部 分图像。更具体地说,在步骤S102中,模式提取单元20依次在垂直方 向和水平方向上扫描整个图像,如图3所示。由此,模式提取单元20从 图像数据中检测人物的面部,并且确定剪取的位置(范围)。

此外,为了检测具有不同大小的面部,还可以如图3所示,将加载 的图像数据依次以预定缩小比率缩小,并且以前述方式扫描用于面部检 测的图像。通过上述处理剪取的部分图像,成为在稍后的阶段中执行的 识别中的关于图像是否包括人物的面部的确定的目标。

在步骤S103中,特征量计算单元30计算如下的特征量,该特征量 用来从由模式提取单元20剪取的部分图像中识别期望的对象。对于用来 识别人物的面部的特征量,可以使用诸如眼睛之间的距离与从嘴到眼睛 的高度(距离)的比率的面部的特征。

下面,参照图4,来描述获取眼睛之间的距离与从嘴到眼睛的距离的 比率的方法。如图4所示,特征量计算单元30从由模式提取单元20所 剪取的部分图像R中,提取亮度比周围部分的亮度暗的三个部分,作为 眼睛和嘴的候选对象。此外,特征量计算单元30计算眼睛之间的距离L1 和从眼睛到嘴的距离L2(图4)。另外,特征量计算单元30通过下面的 表达式(1)计算用于面部区分的特征量f:

[数学式1]

f=L1/L2

在图4所示的示例中,部分图像R是人物的面部的图像(面部图像)。 然而,如果部分图像R不是面部图像,则特征量计算单元30执行对眼睛 和嘴的候选对象的三个部分的提取以及对特征量f的计算。

另外,通过使用指示人物的面部的多个特征量的组合,能够以高精 度执行对人物的面部的识别。更具体地说,还可以利用Viola and Jones, ″Rapid Object Detection using Boosted Cascade of Simple Features″, Proceedings of the IEEE Conference on Computer Vision and Pattern  Recognition(CVPR′01)讨论的、组合使用多个特征量的传统方法。在这 种传统方法中,组合使用六千或更多个指示特定区域中的明度对比的特 征量。

在步骤S104中,似然性计算单元40基于由特征量计算单元30计算 的特征量,并且使用对象字典100,来计算作为识别目标的对象的似然性。

对象字典100(在本示例性实施例中,对象字典100是包括人物的面 部的数据的字典)事先将与特征量f的值相对应的似然性(指示包括人物 的面部的部分图像的似然性的值)存储为表。在本示例性实施例中,似 然性计算单元40基于特征量f的值来确定用于参照的表的箱(bin),并 且计算存储在所确定的箱中的值作为似然性。

图5示出了表的示例。参照图5,似然性在垂直轴C上取值。以如 下方式来生成表。

提供要识别的对象(在本示例性实施例中为人物的面部的图像)的 多个样本图像模式,以及识别目标对象之外的对象的多个样本图像模式。 可以提供一万或更多个模式,作为识别目标样本模式和识别非目标样本 模式中的各个。

此外,特征量计算单元30基于图像模式中的各个来计算特征量f。 似然性计算单元40基于识别目标对象(面部)的所有图像模式之中的特 征量f的值,确定用于参照的表的箱的位置。另外,似然性计算单元40 计算特征量f的频率的分布,作为面部概率分布Pr(f|IF)。在本示例性实 施例中,“IF”表示面部图像模式,而“Pr(f|IF)”表示面部图像模式的特 征量f的概率分布。

另外,似然性计算单元40基于识别目标对象(面部)之外的对象的 所有图像模式的特征量f的值,来确定用于参照的表的箱的位置,并且计 算频率的分布,作为非面部概率分布Pr(f|INF)。在本示例性实施例中, “INF”表示非面部图像模式,而“Pr(f|INF)”表示非面部图像模式的特征 量f的概率分布。可以由下面的表达式(2)计算面部似然性C:

[数学式2]

C=log[{Pr(f|IF)}/{Pr(f|INF)}]

因此,可以针对特征量f的各个箱,对对象字典设置通过表达式(2) 计算的似然性C的值。

如前所述,通过组合使用人物的面部的特征的多个特征量,能够以 高精度执行面部识别。在计算似然性时组合使用多个特征量时,似然性 计算单元40计算多个特征量中的各个的似然性,并且将似然性值的总和 设置为面部似然性。更具体地说,可以由下面的表达式(3)计算面部似 然性C:

[数学式3]

C=ΣkCk(fk)

其中,“fk”表示第k个特征量,“Ck(fk)”表示与特征量fk相对应的 似然性。

在步骤S105中,对象确定单元50基于在步骤S104中由似然性计算 单元40计算的对象的似然性,来确定由模式提取单元20剪取的部分图 像是否是识别目标对象。

更具体地说,如果确定在步骤S104中计算的面部似然性C大于预定 阈值T,则确定要对照的部分图像模式是面部图像。另一方面,如果确定 面部似然性C等于或小于预定阈值T,则确定要对照的部分图像模式是 非面部图像。

在步骤S106中,如果确定部分图像是面部图像(步骤S105中的 “是”),则对象确定单元50将部分图像的位置作为识别结果存储在存储 单元(未示出)中。另一方面,如果对象确定单元50确定部分图像是非 面部图像(步骤S105中的“否”),则处理返回到步骤S102。在如图3 所示的图像内,依次重复执行步骤S102直到步骤S106中的处理。

在步骤S107中,识别结果输出单元60在显示器上显示存储在存储 单元(未示出)上的识别结果(被确定是面部图像的部分图像的位置), 如图6所示。图6所示的示例中的矩形部分指示重叠显示在输入图像上 的面部识别的结果。

现在,将在下面详细描述上述操作(2),即用于识别属于低级别类别 的特定对象的设置。

图7是示出执行用于识别属于低级别类别的特定对象的设置的处理 的示例的流程图。在本示例性实施例中,将描述识别图像中的特定人物 的面部的方法。

参照图7,在根据本示例性实施例的方法中,在步骤S101中,图像 输入单元10获取由摄像单元拍摄的图像的数据。在本示例性实施例中, 假设图像输入单元10获取特定人物(例如人物A)的面部的图像的数据。 将图像数据存储在图像存储器(未示出)上。

在步骤S102中,模式提取单元20从图像存储器加载在步骤S101中 获取的图像数据,并且从图像数据中剪取作为对象识别的目标区域的部 分图像。在步骤S103中,特征量计算单元30计算用来从由模式提取单 元20剪取的部分图像中识别特定人物的面部的特征量。

在步骤S201中,特征量计算单元30将计算的特征量值临时存储在 存储单元(未示出)上。

在步骤S104中,似然性计算单元40基于由特征量计算单元30计算 的特征量,并且使用对象字典100,来计算作为识别目标的对象的似然性。 在步骤S105中,对象确定单元50基于在步骤S104中由似然性计算单元 40计算的对象的似然性,来确定由模式提取单元20剪取的部分图像是否 是识别目标对象。

如果对象确定单元50确定部分图像是面部图像(步骤S105中的 “是”),则处理前进到步骤S202。在步骤S202中,字典生成单元200 基于在步骤S201中临时存储的特征量来生成字典。另一方面,如果对象 确定单元50确定部分图像是非面部图像(步骤S105中的“否”),则处 理返回到步骤S102。在如图3所示的图像内依次重复执行步骤S102直到 步骤S202中的处理。

如果被确定是非面部图像的部分图像或者在生成字典时使用的部分 图像是图像的最后的部分图像,则处理返回到步骤S101。在步骤S101 中,图像输入单元10获取拍摄了人物A的面部的另一图像,并且重复步 骤S101直到步骤S202中的处理。

通过执行上述方法,本示例性实施例能够使用特定人物(人物A) 的面部图像,来生成专门包括人物A的面部的图像的数据的字典。

更具体地说,似然性计算单元40使用基于在步骤S201中存储的人 物A的面部图像模式而计算的特征量f,来确定用于参照的表的箱的位 置。另外,似然性计算单元40计算人物A的面部的图像的特征量f的频 率的分布,作为面部概率分布Pr(f|IFA)。

在本示例性实施例中,“IFA”表示人物A的面部图像模式,而“Pr (f|IFA)”表示面部图像模式的特征量f的概率分布。

可以通过下面的表达式(4)来计算人物A的面部似然性CA

[数学式4]

CA=log[{Pr(f|IFA)}/{Pr(f|INF)}]

其中,“Pr(f|INF)”表示非面部图像模式的特征量f的概率分布。因此, 可以针对特征量f的各个箱,对对象字典设置通过表达式(4)计算的似 然性CA的值。

在通过组合使用多个特征量来执行识别时,可以针对各个特征量生 成针对特定人物的字典。通过获取并使用尽可能多的特定人物的样本图 像,能够以高精度执行对特定人物的识别。

还可以对在步骤S105中被确定是面部图像的部分图像模式执行诸如 校正预定量的图像位置偏移、变倍和亮度转换等的图像处理,基于一个 部分面部图像来生成多个部分面部图像,并且计算并获取多个特征量。

然而,如果仅获取了少量的特征量的样本,则概率分布的精度无法 变高。因此,还可以在生成字典时,使用利用如下的正态分布而进行了 近似的概率分布,其中,所述正态分布是基于获取的特征量的值而计算 的。

如果人物A的面部比一般人物的面部长,则指示特征量f的似然性 的表还可以具有特征量f的如下分布,该分布与图5所示的面部图像表相 比偏向小值,如图8所示。

在步骤S203中,控制单元将在步骤S202中生成的特定对象字典存 储在特定对象字典110上。在执行上述处理之后,执行用于识别属于低 级别类别的特定对象的设置的处理结束。

现在,将在下面详细描述操作(3),即识别属于低级别类别的特定对 象的方法。

图9是示出根据针对属于低级别类别的特定对象的字典中的设置、 来识别属于低级别类别的特定对象的处理的示例的流程图。

在图9所示的处理中,在步骤S101中,图像输入单元10获取由摄 像单元(未示出)拍摄的图像的数据。在步骤S102中,模式提取单元20 从图像存储器加载在步骤S101中获取的图像数据,并且从图像数据中剪 取作为对象识别的目标区域的部分图像,作为输入模式。

在步骤S103中,特征量计算单元30计算如下的特征量,该特征量 用来从由模式提取单元20剪取的部分图像中识别期望的对象。在步骤 S201中,控制单元(未示出)将特征量计算单元30计算的特征量的值临 时存储在存储单元(未示出)上。

在步骤S104中,似然性计算单元40基于由特征量计算单元30计算 的特征量,并且使用事先存储的对象字典100,来计算作为识别目标的对 象的似然性。在步骤S105中,对象确定单元50基于在步骤S104中由似 然性计算单元40计算的对象的似然性,来确定由模式提取单元20剪取 的部分图像是否是识别目标对象。更具体地说,对象确定单元50确定部 分图像是否是人物的面部的图像。

如果对象确定单元50确定部分图像是面部图像(步骤S105中的 “是”),则处理前进到步骤S106。在步骤S106中,控制单元(未示出) 将面部图像的位置作为识别结果存储在存储单元(未示出)上。另一方 面,如果对象确定单元50确定部分图像是非面部图像(步骤S105中的 “否”),则处理返回到步骤S102。

在步骤S301中,似然性计算单元40使用特定对象字典110,基于在 步骤S201中临时存储的特征量,来计算识别目标对象的似然性。

更具体地说,在步骤S301中,通过事先在特定对象字典110(在本 示例性实施例中为针对人物A的面部的图像的字典)中设置与特征量f 的值相对应的似然性作为表,似然性计算单元40根据特征量f的值确定 用于参照的表的箱的位置,并且计算存储在所确定的箱中的值作为似然 性。

在计算似然性时组合使用多个特征量时,似然性计算单元40计算多 个特征量中的各个的似然性,并且将似然性值的总和设置为面部似然性。 更具体地说,可以通过下面的表达式(5)来计算人物A的面部似然性 CA

[数学式5]

CA=ΣACAk(fk)

其中,“fk”表示第k个特征量,“CAk(fk)”表示与特征量fk相对应的 似然性。

还可以强调专门针对人物A计算的特征量,以与一般人物的面部的 特征量的分布进行区别。在这种情况下,可以利用下面的表达式(6)并 基于面部似然性,来对各个特征量的似然性分配权重:

[数学式6]

CA=Σkwk*CAk(fk)

其中,wk={w*Ck(fk)}-N,w和N是常数。

在步骤S302中,对象确定单元50根据由似然性计算单元40计算的 特定对象的似然性,确定由模式提取单元20剪取的部分图像是否是特定 对象的图像。

更具体地说,如果确定在步骤S301中计算的特定人物的面部的似然 性CA大于预定阈值TA(步骤S302中的“是”),则确定要对照的部分图 像的模式是人物A的面部的图像。另一方面,如果确定特定人物的面部 的似然性CA等于或小于预定阈值TA(步骤S302中的“否”),则确定要 对照的部分图像的模式不是人物A的面部的图像。

如果对象确定单元50确定部分图像是特定人物的面部的图像(步骤 S302中的“是”),则处理前进到步骤S303。在步骤S303中,控制单元 (未示出)将部分图像的位置作为识别结果存储在存储单元(未示出) 上。另一方面,如果对象确定单元50确定部分图像不是特定人物的面部 的图像(步骤S302中的“否”),则处理返回到步骤S102。对如图3所示 的图像内的部分图像中的各个,执行步骤S102直到步骤S303中的处理。

在步骤S304中,识别结果输出单元60在显示器上显示在步骤S106 中存储在存储单元(未示出)上的识别结果,如图10所示。

在图10所示的示例中,以细线绘制的矩形部分指示叠加显示在输入 图像上的面部识别的结果,而以粗线绘制的矩形部分指示以叠加显示在 输入图像上的识别特定人物(人物A)的面部的结果。

如果被确定是非面部图像的部分图像、被确定不是特定人物的面部 的图像的部分图像或者存储了识别结果的部分图像是图像中的最后的部 分图像,并且如果要处理另一图像,则处理返回到步骤S101。

如上所述,本示例性实施例在识别低级别类别对象时,共通地使用 用于识别高级别类别对象的特征量。因此,本示例性实施例能够在不另 外执行复杂的处理的情况下,容易地执行对高级别类别对象和低级别类 别对象的识别。

根据本示例性实施例的模式识别系统不一定仅包括诸如照相机等的 一个装置。更具体地说,根据本示例性实施例的模式识别系统还可以包 括两个或更多个装置(包括照相机及计算机系统等)。

还可以由包括面部识别功能的照相机来拍摄特定人物的面部图像, 并且将拍摄的特定人物的面部图像输出给包括识别功能和字典生成功能 的系统。在这种情况下,可以将生成的字典存储在照相机上。

图11示出了模式识别系统的上述配置的示例。参照图11,模式识别 系统包括照相机1和计算机系统2。

照相机1包括图像输入单元10、模式提取单元20、特征量计算单元 30、似然性计算单元40、对象确定单元50、识别结果输出单元60、对象 字典100和特定对象字典110。计算机系统2包括图像获取单元300、模 式提取单元20、特征量计算单元30、似然性计算单元40、对象确定单元 50、字典生成单元200、对象字典100和对象字典输出单元310。

照相机1和计算机系统2中的各个的特征量计算单元30计算用来识 别人物的面部的图像的特征量。照相机1和计算机系统2中的各个的对 象字典100存储作为面部识别的目标的对象的特征。

计算机系统2的图像获取单元300经由存储介质或通信介质等(未 示出),从照相机1的图像输入单元10获取图像数据。对象字典输出单 元310将存储在由字典生成单元200生成的对象字典中的信息,经由存 储介质或通信介质等(未示出)输出给照相机1的特定对象字典110。模 式识别系统的其它配置与图1所示的配置类似。

现在,将在下面详细描述具有上述配置的模式识别系统的操作。在 执行用于识别特定人物的面部的处理的设置时,照相机1使用图像输入 单元10获取特定人物的面部图像。将由照相机1拍摄的图像经由存储介 质(例如压缩闪存(CF)卡)或者通信介质(例如诸如通用串行总线(USB) 线缆等的数据通信线缆),发送给计算机系统2的图像获取单元300。

计算机系统2针对各个部分图像,使用模式提取单元20、特征量计 算单元30、似然性计算单元40和对象确定单元50,来对获取的图像数 据执行面部识别处理。

字典生成单元200基于被确定是特定人物的面部图像的部分图像的 模式的特征量,来生成特定人物的面部的对象字典。

之后,对象字典输出单元310经由存储介质或者通信介质(未示出) 输出生成的对象字典。将对象字典存储在照相机1的特定对象字典110 上。

随后,照相机1基于存储在对象字典100上的面部图像的特征和存 储在特定对象字典110上的特定人物的面部图像的特征,来执行识别处 理。

在本发明的上述示例性实施例中,字典生成单元200生成用于识别 低级别类别对象的特定对象字典110,并且,使用特定对象字典110执行 特定对象的识别。然而,本发明不限于这种配置。

更具体地说,可以事先提供要用来识别特定对象的字典。在这种情 况下,可以基于用于识别高级别类别对象的特征量,使用特定对象字典 来计算似然性,以执行特定对象的识别。

利用上述配置,本发明通过尽可能共通地执行识别处理,还能够在 不另外执行复杂的处理的情况下,执行高级别类别对象的识别和低级别 类别对象的识别。

识别的目标不限于人物的面部。更具体地说,如果要识别人物的面 部之外的对象,则本发明能够组合执行高级别类别对象的识别和低级别 类别对象的识别。

在本发明的上述示例性实施例中,在确定输入图像的模式是否是特 定对象的模式时,使用在识别作为高级别类别对象的预定对象时使用的 特征量。因此,能够使用简单的配置来执行对高级别类别对象和低级别 类别对象的识别。

以下参照附图详细描述本发明的各种示例性实施例、特征和方面。 请注意,在这些实施例中叙述的构成要素的相对布置、数值表达式和数 值,不旨在限制本发明的范围。

本发明的各方面还能够通过读出并执行记录在存储装置上的用于执 行上述实施例的功能的程序的系统或设备的计算机(或诸如CPU或MPU 的装置)、以及由系统或设备的计算机例如读出并执行记录在存储装置上 的用于执行上述实施例的功能的程序来执行步骤的方法来实现。鉴于此, 例如经由网络或者从用作存储装置的各种类型的记录介质(例如计算机 可读介质)向计算机提供程序。

虽然参照示例性实施例对本发明进行了说明,但是应当理解,本发 明不限于所公开的示例性实施例。所附权利要求的范围符合最宽的解释, 以使所述范围涵盖所有变型、等同结构及功能。

本申请要求2009年5月11日提交的日本专利申请第2009-114897 号公报的优先权,其全部内容通过引用,包含于此。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号