首页> 中国专利> 建立模式特征库的方法、装置和相似性匹配方法、装置

建立模式特征库的方法、装置和相似性匹配方法、装置

摘要

本发明提供建立模式特征库的方法、装置和相似性匹配方法、装置,旨在解决现有技术提供的相似性匹配方法的匹配效率低下的技术问题。该方法包括:将用于建立模式特征库的任一模式特征码值分割成N块得到N个子特征码值块;对每个子特征码值块进行编码,使得编码所得的每个子编码特征码值块携带该子特征码值块在模式特征码值中的位置信息;将每个子编码特征码值块包含的信息映射为对应的地址;在映射所得地址存储子编码特征码值块构成模式特征库。由于在比对时只对部分子编码特征码值块比对,在部分子编码特征值块完全匹配时可得出待识别对象的模式特征与模式特征库存储的模式特征相似的结论,满足相似性匹配的本质要求和提高相似性匹配的匹配效率。

著录项

  • 公开/公告号CN104036044A

    专利类型发明专利

  • 公开/公告日2014-09-10

    原文格式PDF

  • 申请/专利权人 TCL集团股份有限公司;

    申请/专利号CN201410309443.9

  • 发明设计人 周龙沙;邵诗强;

    申请日2014-06-30

  • 分类号G06F17/30;G06K9/62;

  • 代理机构深圳中一专利商标事务所;

  • 代理人张全文

  • 地址 516006 广东省惠州市仲恺高新技术开发区十九号小区

  • 入库时间 2023-12-17 01:39:31

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-03-06

    授权

    授权

  • 2015-08-12

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20140630

    实质审查的生效

  • 2014-09-10

    公开

    公开

说明书

技术领域

本发明属于模式识别领域,尤其涉及建立模式特征库的方法、装置和相似 性匹配方法、装置。

背景技术

模式特征的比对是模式识别的一个重要环节,其基本过程是,提取待识别 对象(例如,图像、指纹或纹理等)的模式特征,搜索预先制作的模式特征库, 将所提取的模式特征与模式特征库中的模式特征比对。若经过比对,发现模式 特征库中存在与这个提取的模式特征相同的模式特征,则表示匹配成功。

以上模式特征的比对实际上是一种“硬比对”方法。所谓硬比对,是指待 识别对象的每一个模式特征与模式特征库中所对应的每一个模式特征比对,完 全相同时才确定为匹配成功。然而,随着图像类别的增加出现高维度数据的分 类问题,若采用上述硬比对的方法,往往会随着模式特征库中模式特征的数量 增多以及相应测试量增多,花费的比对时间很长,效率很低。一种解决上述问 题的现有方法是,对所提取的待识别对象的模式特征进行处理,将高维度的数 据转为低维度的数据,再进行相应的匹配。例如,利用空间来换取效率,将所 获取的模式特征进行编码,形成一定大小的数值,将这些数值存储到模式特征 库中。当有新的模式特征产生需要进行匹配时,直接进行位置获取,再进行比 对得到结果。

然而,上述现有方法仍然存在缺陷,即,当模式特征库中的模式特征的数 量很大时,需要的存储空间将变得异常巨大,另外,上述方法本质上还是一种 硬比对,当只需要做相似度匹配时,匹配起来效率相当低下,难以满足实际的 应用需求。

发明内容

本发明的目的在于提供建立模式特征库的方法、装置和相似性匹配方法、 装置,旨在解决现有技术提供的相似性匹配方法的匹配效率低下的技术问题。

本发明是这样实现的,一种建立模式特征库的方法,所述方法包括:

将用于建立模式特征库的任一模式特征码值分割成N块,得到N个子特征 码值块,所述N为大于1的自然数;

对所述每个子特征码值块进行编码,使得编码所得的每个子编码特征码值 块携带该子特征码值块在所述模式特征码值中的位置信息;

将所述每个子编码特征码值块包含的信息映射为对应的地址;

在所述映射所得的地址存储所述子编码特征码值块以构成模式特征库。

本发明的另一目的在于提供一种相似性匹配方法,所述方法包括:

将待识别对象的模式特征码值Cm分割成N块,得到所述待识别对象的N 个子特征码值块,所述N为大于1的自然数;

对所述待识别对象的每个子特征码值块Ci进行编码,使得编码所得的所述 待识别对象的每个子编码特征码值块C’i携带该子特征码值块在所述待识别对 象的模式特征码值Cm中的位置信息;

搜索模式特征库,将所述每子编码特征码值块C’i与所述模式特征库中的 子编码特征码值块匹配;

所述模式特征库采用下述方式建立:

将用于建立模式特征库的任一模式特征码值分割成N块,得到N个子特征 码值块;

对所述每个子特征码值块进行编码,使得编码所得的每个子编码特征码值 块携带该子特征码值块在所述模式特征码值中的位置信息;

将所述每个子编码特征码值块包含的信息映射为对应的地址;

在所述映射所得的地址对应的存储单元存储所述子编码特征码值块以构成 模式特征库。

本发明的另一目的在于提供一种建立模式特征库的装置,所述装置包括:

分割模块,用于将用于建立模式特征库的任一模式特征码值分割成N块, 得到N个子特征码值块,所述N为大于1的自然数;

第一编码模块,用于对所述每个子特征码值块进行编码,使得编码所得的 每个子编码特征码值块携带该子特征码值块在所述模式特征码值中的位置信 息;

映射模块,用于将所述每个子编码特征码值块包含的信息映射为对应的地 址;

存储模块,用于在所述映射所得的地址对应的存储单元存储所述子编码特 征码值块以构成模式特征库。

本发明的另一目的在于提供一种相似性匹配装置,所述装置包括:

码值分割模块,用于将待识别对象的模式特征码值Cm分割成N块,得到 所述待识别对象的N个子特征码值块,所述N为大于1的自然数;

子特征码值编码模块,用于对所述待识别对象的每个子特征码值块Ci进行 编码,使得编码所得的所述待识别对象的每个子编码特征码值块C’i携带该子 特征码值块在所述待识别对象的模式特征码值Cm中的位置信息;

匹配模块,用于搜索模式特征库,将所述每子编码特征码值块C’i与所述 模式特征库中的子编码特征码值块匹配;

所述模式特征库采用下述分割模块、第一编码模块、映射模块和存储模块 建立:

所述分割模块,用于将用于建立模式特征库的任一模式特征码值分割成N 块,得到N个子特征码值块,所述N为大于1的自然数;

所述第一编码模块,用于对所述每个子特征码值块进行编码,使得编码所 得的每个子编码特征码值块携带该子特征码值块在所述模式特征码值中的位置 信息;

所述映射模块,用于将所述每个子编码特征码值块包含的信息映射为对应 的地址;

所述存储模块,用于在所述映射所得的地址对应的存储单元存储所述子编 码特征码值块以构成模式特征库。

从上述本发明实施例可知,模式特征码值被分块并被编码所得的子编码特 征码值块在映射为对应的地址时,由于建立模式特征库所用的模式特征码值被 编码成了多个子编码特征码值块,子编码特征码值块被分散存储,在比对时, 可以根据需要,只对部分子编码特征码值块比对,在部分子编码特征值块完全 匹配时,即可得出待识别对象的模式特征与模式特征库存储的模式特征相似的 结论,既满足了相似性匹配的本质要求(只要求相似,而不要求相同),又提 高了进行相似性匹配的匹配效率。

附图说明

图1是本发明实施例一提供的建立模式特征库的方法的实现流程示意图;

图2是本发明实施例提供的在子特征码值块的结束处之后插入该子特征码 值块在模式特征码值中的位置信息示意图;

图3是本发明实施例二提供的建立模式特征库的方法的实现流程示意图;

图4是本发明实施例三提供的相似性匹配方法的实现流程示意图;

图5是本发明实施例提供的将每子编码特征码值块C’i与模式特征库中的 子编码特征码值块匹配流程示意图;

图6是本发明实施例四提供的建立模式特征库的装置的结构示意图;

图7是本发明实施例五提供的建立模式特征库的装置的结构示意图;

图8-a是本发明实施例六提供的建立模式特征库的装置的结构示意图;

图8-b是本发明实施例七提供的建立模式特征库的装置的结构示意图;

图9是本发明实施例八提供的相似性匹配装置的结构示意图;

图10是本发明实施例九提供的建立模式特征库的装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图 及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施 例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例提供建立模式特征库的方法,所述方法包括:将用于建立模 式特征库的任一模式特征码值分割成N块,得到N个子特征码值块,所述N 为大于1的自然数;对所述每个子特征码值块进行编码,使得编码所得的每个 子编码特征码值块携带该子特征码值块在所述模式特征码值中的位置信息;将 所述每个子编码特征码值块包含的信息映射为对应的地址;在所述映射所得的 地址对应的存储单元存储所述子编码特征码值块以构成模式特征库。本发明实 施例还提供相应的建立模式特征库的装置和相似性匹配方法、装置。以下分别 进行详细说明。

请参阅附图1,是本发明实施例一提供的建立模式特征库的方法的实现流 程,主要包括以下步骤S101至步骤S104:

S101,将用于建立模式特征库的任一模式特征码值分割成N块,得到N个 子特征码值块,其中,N为大于1的自然数。

在本发明实施例中,模式特征码值可以是通过不同应用和算法提取的、能 够表征图像(例如指纹、纹理、脸谱等)的特征的码值,这些码值可以是不同 进制(例如,二进制、十六进制等)的编码,也可以是不同的字符和数字的组 合等等,本发明对模式特征码值的形式不加限制。

与现有技术中直接将模式特征码值作为被比对对象而不加分割不同,在本 发明实施例中,是将用于建立模式特征库的任一模式特征码值分割成N块,得 到N个子特征码值块,其中,每个子特征码值块的大小可以相同,也可以不相 同,即,既可以将任一模式特征码值平均分割成N块,也可以将任一模式特征 码值任意分割成N块。至于N的大小,不宜过小,也不宜太大,原因如下:

若N的值过小,即,每个子特征码值块就会较长,而在相似性匹配时,对 每个子特征码值块是完全匹配的,即,只有待识别对象的子特征码值块与模式 特征库中的子特征码值块完全相同时,才认为是完全匹配,而对于相似性匹配, 只要求待识别对象的特征码值块与模式特征库中的特征码值块部分相同,因此, 如果每个子特征码值块较长,则一方面,在要求待识别对象的子特征码值块与 模式特征库中的子特征码值块完全相同时,有可能不能达到这个要求但实际上 满足了相似性匹配的要求而做出了错误的判断,另一方面,在多数子特征码值 块是完全匹配时,实际上是要求待识别对象的特征码值块与模式特征库中的特 征码值块基本完全相同,这种匹配就违背了相似性匹配的初衷,或者,本质上 已经不是在进行相似性匹配了。

若N的值过大,即,子特征码值块数量较多,每个子特征码值块的长度较 小,每个子编码特征码值块(即通过对子特征码值块添加该子特征码值块在所 述模式特征码值中的位置信息后所得的编码块)相应较小,经过映射所得到的 地址较少,则相应地,同一地址对应的存储单元可能要存储较多的子编码特征 码值块。如此,在进行相似性匹配过程中,当待识别对象的子编码特征码值块 通过映射,寻址到该地址对应的存储单元时,由于该存储单元有众多的子编码 特征码值块,需要再次遍历这些子编码特征码值块,进行二次匹配后才能确认 模式特征库里是否存在子特征码值块,这显然增加了工作量,也降低了匹配的 效率。

基于N的取值不宜过大也不宜过小的事实,可以为N取一个经验值,例如, N大于或等于10。当然,也可以根据进行相似性匹配时要求的相似度,得出一 个经验值。具体地,若进行相似性匹配时要求的相似度为X%(X取值为1~99 之间的任意值),记N_temp=(X%*模式特征码值的长度)/[模式特征码值- (X%*模式特征码值的长度)],则N可以取其中,符号表示对N_temp的值向上取整,例如,计算所得N_temp=10.3,则

S102,对每个子特征码值块进行编码,使得编码所得的每个子编码特征码 值块携带该子特征码值块在模式特征码值中的位置信息。

在本发明实施例中,子特征码值块在模式特征码值中的位置信息可以是这 些位置的二进制编码。作为本发明一个实施例,对每个子特征码值块进行编码, 使得编码所得的每个子编码特征码值块携带该子特征码值块在模式特征码值中 的位置信息可以是:在子特征码值块的固定位置插入该子特征码值块在模式特 征码值中的位置信息,得到该子特征码值块的子编码特征码值块。

为了在相似性匹配过程中对子编码特征码值块的解码方便,在子特征码值 块的固定位置插入该子特征码值块在模式特征码值中的位置信息具体可以为: 在子特征码值块的起始处之前或者在子特征码值块的结束处之后插入该子特征 码值块在模式特征码值中的位置信息。如附图2所示,是在子特征码值块的结 束处之后插入该子特征码值块在模式特征码值中的位置信息,其中,“00000001” 是编号为code_1的子编码特征码值块“XXXXX00000001”对应的子特征码值 块“XXX”在如图2示例的模式特征码值中的位置信息,“00000101”是编号 为code_5的子编码特征码值块“XXXXXXXX00000101”对应的子特征码值块 “XXXXXXXX”在如图2示例的模式特征码值中的位置信息,“00001111” 是编号为code_N的子编码特征码值块“XXXXXXX00001111”对应的子特征 码值块“XXXXXXX”在如图2示例的模式特征码值中的位置信息,等等。

S103,将每个子编码特征码值块包含的信息映射为对应的地址。

作为本发明一个实施例,将每个子编码特征码值块包含的信息映射为对应 的地址具体为:通过哈希(Hash)映射,将每个子编码特征码值块包含的信息 映射为对应的地址。例如,子编码特征码值块“XXXXXXXX00000101”通过 采用了某个哈希函数(或散列函数)进行哈希映射后的地址为0x697C9738。

S104,在映射所得的地址对应的存储单元存储所述子编码特征码值块以构 成模式特征库。

例如,如图2所示,若通过映射(例如,哈希映射),子编码特征码值块 “XXXXX00000001”、“XXXXXXXX00000101”、“XXXXXXX00001111” 以及图2示例的模式特征码值的其余N-3个子编码特征码值块分别被存储在 各自映射所得地址对应的存储单元后,该模式特征码值就构成模式特征库中的 一个模式特征码值,当众多的模式特征码值的每个子编码特征码值块分别被存 储在各自映射所得地址对应的存储单元后,就构成整个模式特征库。

从上述本发明实施例提供的建立模式特征库的方法可知,模式特征码值被 分块并被编码所得的子编码特征码值块在映射为对应的地址时,由于建立模式 特征库所用的模式特征码值被编码成了多个子编码特征码值块,子编码特征码 值块被分散存储,在比对时,可以根据需要,只对部分子编码特征码值块比对, 在部分子编码特征值块完全匹配时,即可得出待识别对象的模式特征与模式特 征库存储的模式特征相似的结论,既满足了相似性匹配的本质要求(即,只要 求相似,而不要求相同),又提高了进行相似性匹配的匹配效率。

在上述实施例中,即使对模式特征码值被分割成N块所得的N个子特征码 值块编码,使得编码所得的每个子编码特征码值块携带该子特征码值块在模式 特征码值中的位置信息,然而,再将每个子编码特征码值块包含的信息映射为 对应的地址时发现,这种方式映射(例如,哈希映射)得到的地址的范围仍然 比较小,这就意味着同一地址对应的存储单元可能要存储较多的子编码特征码 值块。例如,假设使用上述实施例提供的方法,其通过映射只能得到256个地 址对应的存储单元,而另一种方法,其通过映射能得到512个地址对应的存储 单元,在同样多的子编码特征码值块的情况下,前者在同一地址对应的存储单 元可能要存储较多的子编码特征码值块。如此,在进行相似性匹配过程中,当 待识别对象的子编码特征码值块通过映射,寻址到该地址对应的存储单元时, 由于该存储单元有众多的子编码特征码值块,需要再次遍历这些子编码特征码 值块,进行二次匹配后才能确认模式特征库里是否存在子特征码值块,这显然 增加了工作量,也降低了匹配的效率。

为了解决上述问题,在本发明另一实施例中,对每个子特征码值块进行编 码,使得编码所得的每个子编码特征码值块携带该子特征码值块在模式特征码 值中的位置信息之后,还包括:根据位置信息,对每个子编码特征码值块进行 二次编码,得到N个长子编码特征码值块。相应地,前述实施例中,将每个子 编码特征码值块包含的信息映射为对应的地址具体为:将经过所述二次编码得 到的每个长子编码特征码值块包含的信息映射为对应的地址。

相应于对每个子特征码值块进行编码,使得编码所得的每个子编码特征码 值块携带该子特征码值块在模式特征码值中的位置信息之后,还包括:根据位 置信息,对每个子编码特征码值块进行二次编码,得到N个长子编码特征码值 块;将每个子编码特征码值块包含的信息映射为对应的地址具体为:将经过所 述二次编码得到的每个长子编码特征码值块包含的信息映射为对应的地址;以 及在映射所得的地址对应的存储单元存储子编码特征码值块以构成模式特征库 具体为在映射所得的地址对应的存储单元存储长子编码特征码值块以构成模式 特征库的实施例,本发明实施例二提供的建立模式特征库的方法的实现流程如 附图3所示,主要包括以下步骤S301至步骤S305:

S301,将用于建立模式特征库的任一模式特征码值分割成N块,得到N个 子特征码值块,其中,N为大于1的自然数。

在本发明实施例中,模式特征码值可以是通过不同应用和算法提取的、能 够表征图像(例如指纹、纹理、脸谱等)的特征的码值,这些码值可以是不同 进制(例如,二进制、十六进制等)的编码,也可以是不同的字符和数字的组 合等等,本发明对模式特征码值的形式不加限制。

与现有技术中直接将模式特征码值作为被比对对象而不加分割不同,在本 发明实施例中,是将用于建立模式特征库的任一模式特征码值分割成N块,得 到N个子特征码值块,其中,每个子特征码值块的大小可以相同,也可以不相 同,即,既可以将任一模式特征码值平均分割成N块,也可以将任一模式特征 码值任意分割成N块。至于N的大小,不宜过小,也不宜太大,原因如下:

若N的值过小,即,每个子特征码值块就会较长,而在相似性匹配时,对 每个子特征码值块是完全匹配的,即,只有待识别对象的子特征码值块与模式 特征库中的子特征码值块完全相同时,才认为是完全匹配,而对于相似性匹配, 只要求待识别对象的特征码值块与模式特征库中的特征码值块部分相同,因此, 如果每个子特征码值块较长,则一方面,在要求待识别对象的子特征码值块与 模式特征库中的子特征码值块完全相同时,有可能不能达到这个要求但实际上 满足了相似性匹配的要求而做出了错误的判断,另一方面,在多数子特征码值 块是完全匹配时,实际上是要求待识别对象的特征码值块与模式特征库中的特 征码值块基本完全相同,这种匹配就违背了相似性匹配的初衷,或者,本质上 已经不是在进行相似性匹配了。

若N的值过大,即,子特征码值块数量较多,每个子特征码值块的长度较 小,每个子编码特征码值块(即通过对子特征码值块添加该子特征码值块在所 述模式特征码值中的位置信息后所得的编码块)相应较小,经过映射所得到的 地址较少,则相应地,同一地址对应的存储单元可能要存储较多的子编码特征 码值块。如此,在进行相似性匹配过程中,当待识别对象的子编码特征码值块 通过映射,寻址到该地址对应的存储单元时,由于该存储单元有众多的子编码 特征码值块,需要再次遍历这些子编码特征码值块,进行二次匹配后才能确认 模式特征库里是否存在子特征码值块,这显然增加了工作量,也降低了匹配的 效率。

基于N的取值不宜过大也不宜过小的事实,可以为N取一个经验值,例如, N大于或等于10。当然,也可以根据进行相似性匹配时要求的相似度,得出一 个经验值。具体地,若进行相似性匹配时要求的相似度为X%(X取值为1~99 之间的任意值),记N_temp=(X%*模式特征码值的长度)/[模式特征码值- (X%*模式特征码值的长度)],则N可以取其中,符号表示对N_temp的值向上取整,例如,计算所得N_temp=10.3,则

S302,对每个子特征码值块进行编码,使得编码所得的每个子编码特征码 值块携带该子特征码值块在模式特征码值中的位置信息。

在本发明实施例中,子特征码值块在模式特征码值中的位置信息可以是这 些位置的二进制编码。作为本发明一个实施例,对每个子特征码值块进行编码, 使得编码所得的每个子编码特征码值块携带该子特征码值块在模式特征码值中 的位置信息可以是:在子特征码值块的固定位置插入该子特征码值块在模式特 征码值中的位置信息,得到该子特征码值块的子编码特征码值块。

为了在相似性匹配过程中对子编码特征码值块的解码方便,在子特征码值 块的固定位置插入该子特征码值块在模式特征码值中的位置信息具体可以为: 在子特征码值块的起始处之前或者在子特征码值块的结束处之后插入该子特征 码值块在模式特征码值中的位置信息。如附图2所示,是在子特征码值块的结 束处之后插入该子特征码值块在模式特征码值中的位置信息,其中,“00000001” 是编号为code_1的子编码特征码值块“XXXXX00000001”对应的子特征码值 块“XXX”在如图2示例的模式特征码值中的位置信息,“00000101”是编号 为code_5的子编码特征码值块“XXXXXXXX00000101”对应的子特征码值块 “XXXXXXXX”在如图2示例的模式特征码值中的位置信息,“00001111” 是编号为code_N的子编码特征码值块“XXXXXXX00001111”对应的子特征 码值块“XXXXXXX”在如图2示例的模式特征码值中的位置信息,等等。

S303,根据步骤S302中涉及的位置信息,对每个子编码特征码值块进行 二次编码,得到N个长子编码特征码值块。

理论表明,若子特征码值块经过编码,得到的子编码特征码值块越长,对 这些子编码特征码值块包含的信息进行映射(例如,哈希映射)得到的地址范 围更宽泛。因此,根据步骤S302中涉及的位置信息,对每个子编码特征码值块 进行二次编码,得到N个长子编码特征码值块。由于长子编码特征码值块比二 次编码之前的子编码特征码值块要长,在对这N个长子编码特征码值块包含的 信息进行映射(例如,哈希映射)时,可以得到范围更宽泛或更稀疏的地址。

具体地,对每个子编码特征码值块进行二次编码,得到N个长子编码特征 码值块可以是:将每个子编码特征码值块中子特征码值块的最后一个编码值取 出,将这个最后一个编码值的八位二进制编码与该子编码特征码值块中的位置 信息对应的八位二进制编码进行某种逻辑运算,例如,异或运算,得到一个新 的编码值,再将这个新的编码值追加至该子编码特征码值块的结束处,从而得 到所述的长子编码特征码值块。

例如,图2示例的子编码特征码值块“XXXXX00000101”具体是 “2B87A54Z00000101”,其子特征码值块“2B87A54Z”的最后一个编码值Z 的八位二进制编码是01011111,该子编码特征码值块中的位置信息对应的八位 二进制编码是00000101,将01011111与00000101进行某种逻辑运算,例如, 将01011111与00000101进行异或,得到一个新的编码值是01011111,再将这 个新的编码值01011111追加至该子编码特征码值块2B87A54Z00000101的结束 处,从而得到一个长子编码特征码值块2B87A54Z0000010101011111。

S304,将经过二次编码得到的每个长子编码特征码值块包含的信息映射为 对应的地址。

作为本发明一个实施例,将每个长子编码特征码值块包含的信息映射为对 应的地址具体为:通过哈希(Hash)映射,将每个长子编码特征码值块包含的 信息映射为对应的地址。例如,将步骤S303示例的2B87A54Z0000010101011111 进行映射,例如,哈希映射,所得地址为0x697C9739CA2B。以这种方法得到 的地址更大,范围更宽。若是哈希映射,则体现为在哈希表(Hash)表中的映 射范围更加稀疏,在进行相似性匹配时,匹配效率更加高效。

S305,在映射所得的地址对应的存储单元存储所述长子编码特征码值块以 构成模式特征库。

例如,若通过映射(例如,哈希映射),长子编码特征码值块 “2B87A54Z0000010101011111”以及图2示例的模式特征码值的其余N-1个 长子编码特征码值块分别被存储在各自映射所得地址对应的存储单元后,该模 式特征码值就构成模式特征库中的一个模式特征码值,当众多的模式特征码值 的每个长子编码特征码值块分别被存储在各自映射所得地址对应的存储单元 后,就构成整个模式特征库。

从上述本发明实施例提供的建立模式特征库的方法可知,模式特征码值被 分块并被编码所得的子编码特征码值块在映射为对应的地址时,由于建立模式 特征库所用的模式特征码值被编码成了多个长子编码特征码值块,长子编码特 征码值块被分散存储,在比对时,可以根据需要,只对部分长子编码特征码值 块比对,在部分长子编码特征值块完全匹配时,即可得出待识别对象的模式特 征与模式特征库存储的模式特征相似的结论,既满足了相似性匹配的本质要求 (即,只要求相似,而不要求相同),又提高了进行相似性匹配的匹配效率。

请参阅附图4,是本发明实施例三提供的相似性匹配方法的实现流程。在 附图4示例的相似性匹配方法中,其所使用到的模式特征库采用附图1或附图 3示例的建立模式特征库的方法建立,即,将用于建立模式特征库的任一模式 特征码值分割成N块,得到N个子特征码值块;对所述每个子特征码值块进行 编码,使得编码所得的每个子编码特征码值块携带该子特征码值块在所述模式 特征码值中的位置信息;将所述每个子编码特征码值块包含的信息映射为对应 的地址;在所述映射所得的地址对应的存储单元存储所述子编码特征码值块以 构成模式特征库。

附图4示例的相似性匹配方法主要包括以下步骤S401至步骤S403:

S401,将待识别对象的模式特征码值Cm分割成N块,得到待识别对象的 N个子特征码值块,其中,N为大于1的自然数。

也就是说,按照附图1或附图3示例的建立模式特征库的方法时对模式特 征码值分割成子特征码值块的方法相同的方法,将待识别对象的模式特征码值 Cm分割成N块。例如,若在附图1或附图3示例的建立模式特征库的方法中, 对模式特征码值平均分割成N个子特征码值块即每个子特征码值块长度相同, 则也将待识别对象的模式特征码值Cm平均分割成N个子特征码值块;若在附 图1或附图3示例的建立模式特征库的方法中,对模式特征码值任意分割成N 个子特征码值块即每个子特征码值块的长度长短不一,则也将待识别对象的模 式特征码值Cm分割成长度长短不一的N个子特征码值块;并且,N的取值原 则也与附图1或附图3示例的建立模式特征库的方法中,模式特征码值分割成 N个子特征码值块时N的取值原则相同。

S402,对待识别对象的每个子特征码值块Ci进行编码,使得编码所得的待 识别对象的每个子编码特征码值块C’i携带该子特征码值块在待识别对象的模 式特征码值Cm中的位置信息。

本步骤与附图1或附图3示例的对每个子特征码值块进行编码,使得编码 所得的每个子编码特征码值块携带该子特征码值块在模式特征码值中的位置信 息相同,不做赘述,可参阅前述实施例的说明部分。

S403,搜索模式特征库,将每个子编码特征码值块C’i与模式特征库中的 子编码特征码值块匹配。

具体地,将每个子编码特征码值块C’i与模式特征库中的子编码特征码值 块匹配包括附图5示例的步骤S501至步骤S503:

S501,将待识别对象的子编码特征码值块C’i映射为地址A。

待识别对象的子编码特征码值块C’i对应的子特征码值块Ci在待识别对象 的模式特征码值Cm中位置P处,地址A是模式特征库存储子编码特征码值块 的诸多地址中的一个地址。

S502,将映射为地址A的子编码特征码值块C’i与地址A中存储并且位于 模式特征码值中位置P处所对应的子编码特征码值块比对。

例如,假设待识别对象的子编码特征码值块C’i对应的子特征码值块Ci在 待识别对象的模式特征码值Cm中位置P处,位置P处的位置信息的二进制编 码为00000101,则在对比时,是将子编码特征码值块C’i与模式特征库的地址 A的存储单元存储,并且在模式特征码值中的位置信息的二进制编码亦为 00000101的子编码特征码值块比对。

S503,若映射为地址A的子编码特征码值块C’i与地址A中存储并且位于 模式特征码值中位置P处所对应的子编码特征码值块相同,则重复步骤S501 和步骤S502。

若经过步骤S501至步骤S503,在待识别对象的模式特征码值Cm中n个 位置的n个子特征码值块对应的n个子编码特征码值块与模式特征库中存储并 且位于模式特征码值中n个相同位置的n个子特征码值块对应的n个子编码特 征码值块分别相同,则待识别对象的模式特征码值Cm与所述模式特征库存储 的模式特征码值匹配成功,其中,n为根据实际需要指定,且n≤N。

在本发明实施例中,n的取值根据实际需要指定,可以理解为根据相似性 匹配时对相似度的要求而定。具体地,若相似度为c,则n可以取c*N,例如, 若要求相似度为90%,则n=90%*N。

在附图4或附图5的实施例中,对每个子特征码值块进行编码,使得编码 所得的每个子编码特征码值块携带该子特征码值块在模式特征码值中的位置信 息,包括:在子特征码值块的固定位置插入该子特征码值块在模式特征码值中 的位置信息,得到该子特征码值块的子编码特征码值块。具体地,在子特征码 值块的固定位置插入该子特征码值块在模式特征码值中的位置信息为:在子特 征码值块的起始处之前或者在子特征码值块的结束处之后插入该子特征码值块 在模式特征码值中的位置信息。

具体地,将每个子编码特征码值块包含的信息映射为对应的地址为:通过 哈希映射,将每个子编码特征码值块包含的信息映射为对应的地址。

进一步地,对每个子特征码值块进行编码,使得编码所得的每个子编码特 征码值块携带该子特征码值块在所述模式特征码值中的位置信息之后,还包括: 根据所述位置信息,对每个子编码特征码值块进行二次编码,得到N个长子编 码特征码值块;将每个子编码特征码值块包含的信息映射为对应的地址具体为: 将经过二次编码得到的每个长子编码特征码值块包含的信息映射为对应的地 址。

具体地,在映射所得的地址对应的存储单元存储子编码特征码值块以构成 模式特征库为:在映射所得的地址对应的存储单元存储长子编码特征码值块以 构成模式特征库。

请参阅附图6,是本发明实施例四提供的建立模式特征库的装置的结构示 意图。为了便于说明,仅示出了与本发明实施例相关的部分。附图6示例的建 立模式特征库的装置主要包括分割模块601、第一编码模块602、映射模块603 和存储模块604,各功能模块详细说明如下:

分割模块601,用于将用于建立模式特征库的任一模式特征码值分割成N 块,得到N个子特征码值块,所述N为大于1的自然数;

第一编码模块602,用于对所述每个子特征码值块进行编码,使得编码所 得的每个子编码特征码值块携带该子特征码值块在所述模式特征码值中的位置 信息;

映射模块603,用于将所述每个子编码特征码值块包含的信息映射为对应 的地址;

存储模块604,用于在所述映射所得的地址对应的存储单元存储所述子编 码特征码值块以构成模式特征库。

附图6示例的第一编码模块602可以包括插入单元701,如附图7所示本 发明实施例五提供的建立模式特征库的装置。插入单元701用于在所述子特征 码值块的固定位置插入该子特征码值块在所述模式特征码值中的位置信息,得 到该子特征码值块的子编码特征码值块。

附图7示例的插入单元701具体用于在所述子特征码值块的起始处之前或 者在所述子特征码值块的结束处之后插入该子特征码值块在所述模式特征码值 中的位置信息。

附图6示例的映射模块603具体用于通过哈希映射,将所述每个子编码特 征码值块包含的信息映射为对应的地址。

附图6或附图7示例的建立模式特征库的装置还可以包括第二编码模块 801,如附图8-a或8-b所示本发明实施例六或实施例七提供的建立模式特征库 的装置。第二编码模块801用于根据所述位置信息,对所述每个子编码特征码 值块进行二次编码,得到N个长子编码特征码值块。此时,映射模块603具体 用于将经过所述二次编码得到的每个长子编码特征码值块包含的信息映射为对 应的地址;存储模块604具体用于在所述映射所得的地址对应的存储单元存储 所述长子编码特征码值块以构成模式特征库。

请参阅附图9,是本发明实施例八提供的相似性匹配装置的结构示意图。 为了便于说明,仅示出了与本发明实施例相关的部分。附图9示例的相似性匹 配装置主要包括码值分割模块901、子特征码值编码模块902和匹配模块903, 各功能模块详细说明如下:

码值分割模块901,用于将待识别对象的模式特征码值Cm分割成N块, 得到所述待识别对象的N个子特征码值块,所述N为大于1的自然数;

子特征码值编码模块902,用于对所述待识别对象的每个子特征码值块Ci进行编码,使得编码所得的所述待识别对象的每个子编码特征码值块C’i携带 该子特征码值块在所述待识别对象的模式特征码值Cm中的位置信息;

匹配模块903,用于搜索模式特征库,将所述每个子编码特征码值块C’i与所述模式特征库中的子编码特征码值块匹配。

在附图9示例的相似性匹配装置中,模式特征库采用下述分割模块、第一 编码模块、映射模块和存储模块建立:

所述分割模块,用于将用于建立模式特征库的任一模式特征码值分割成N 块,得到N个子特征码值块,所述N为大于1的自然数;

所述第一编码模块,用于对所述每个子特征码值块进行编码,使得编码所 得的每个子编码特征码值块携带该子特征码值块在所述模式特征码值中的位置 信息;

所述映射模块,用于将所述每个子编码特征码值块包含的信息映射为对应 的地址;

所述存储模块,用于在所述映射所得的地址对应的存储单元存储所述子编 码特征码值块以构成模式特征库。

附图9示例的匹配模块903可以包括地址映射单元1001和比对单元1002, 如附图10所示本发明实施例九提供的建立模式特征库的装置,其中:

地址映射单元1001,用于将所述待识别对象的子编码特征码值块C’i映射 为地址A,所述待识别对象的子编码特征码值块C’i对应的子特征码值块Ci在 所述待识别对象的模式特征码值Cm中位置P处,所述地址A是所述模式特征 库存储所述子编码特征码值块的诸多地址中的一个地址;

比对单元1002,用于将所述映射为地址A的子编码特征码值块C’i与所述 地址A中存储并且位于所述模式特征码值中位置P处所对应的子编码特征码值 块比对。

附图10示例的建立模式特征库的装置中,若所述映射为地址A的子编码 特征码值块C’i与所述地址A中存储并且位于所述模式特征码值中位置P处所 对应的子编码特征码值块相同,则所述地址映射单元1001和所述比对单元1002 重复执行;

若经过所述地址映射单元1001和所述比对单元1002的重复执行,在所述 待识别对象的模式特征码值Cm中n个位置的n个子特征码值块对应的n个子 编码特征码值块与所述模式特征库中存储并且位于所述模式特征码值中n个相 同位置的n个子特征码值块对应的n个子编码特征码值块分别相同,则待识别 对象的模式特征码值Cm与所述模式特征库存储的模式特征码值匹配成功,所 述n为根据实际需要指定,且n≤N。

对于附图10示例的建立模式特征库的装置,第一编码模块包括插入单元, 用于在所述子特征码值块的固定位置插入该子特征码值块在所述模式特征码值 中的位置信息,得到该子特征码值块的子编码特征码值块。所述插入单元具体 用于在所述子特征码值块的起始处之前或者在所述子特征码值块的结束处之后 插入该子特征码值块在所述模式特征码值中的位置信息。

对于附图10示例的建立模式特征库的装置,映射模块具体用于通过哈希映 射,将所述每个子编码特征码值块包含的信息映射为对应的地址。

对于附图10示例的建立模式特征库的装置,模式特征库还采用下述第二编 码模块建立:

第二编码模块,用于根据所述位置信息,对所述每个子编码特征码值块进 行二次编码,得到N个长子编码特征码值块,此时,所述映射模块具体用于将 经过所述二次编码得到的每个长子编码特征码值块包含的信息映射为对应的地 址,所述存储模块具体用于在所述映射所得的地址对应的存储单元存储所述长 子编码特征码值块以构成模式特征库。

需要说明的是,上述装置各模块/单元之间的信息交互、执行过程等内容, 由于与本发明方法实施例基于同一构思,其带来的技术效果与本发明方法实施 例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤 是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存 储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随 机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。

以上对本发明实施例所提供的建立模式特征库的方法、装置和相似性匹配 方法、装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方 式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思 想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式 及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明 的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号