首页> 中国专利> 生成图像指纹及基于此进行相似图像检索的方法

生成图像指纹及基于此进行相似图像检索的方法

摘要

本发明提供了一种生成图像指纹及基于该方法进行相似图像检索以用于图像盗用识别的方法,所述图像具有M行N列像素,包括如下步骤:a)对所述图像中的每个像素点Xij,其中i=2,3,……M,j=2,3,……N,比较所述像素点与其左像素及上像素的灰度值大小,其中,左像素表示在所述一个像素的相邻的方位上下左右的四个像素中左边的像素,上像素表示在所述一个像素的相邻的方位上下左右的四个像素中上边的像素;b)根据不同的比较结果为所述像素点Xij赋予指纹值Zij;c)将所述每个像素点的指纹值Zij组合为序列得到长度为(M-1)×(N-1)的所述图像的指纹。利用本发明的图像盗用识别方法,能够精准而高效地识别相似图像,防止图像盗用行为。

著录项

  • 公开/公告号CN103699691A

    专利类型发明专利

  • 公开/公告日2014-04-02

    原文格式PDF

  • 申请/专利权人 五八同城信息技术有限公司;

    申请/专利号CN201410012144.9

  • 申请日2014-01-10

  • 分类号G06F17/30(20060101);G06K9/62(20060101);

  • 代理机构北京律恒立业知识产权代理事务所(特殊普通合伙);

  • 代理人顾珊;陈轶兰

  • 地址 300457 天津市滨海新区第一大街79号泰达MSD-C区-C3座2801房间

  • 入库时间 2024-02-19 22:53:23

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-09-12

    授权

    授权

  • 2014-04-30

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20140110

    实质审查的生效

  • 2014-04-02

    公开

    公开

说明书

技术领域

本发明涉及计算机图像检索领域,特别是一种图像盗用识别方法。

背景技术

随着数码拍摄设备的普及,数字图像已经成为重要的信息存储和传 递的媒介,同时数字图像也越来越多地被发布到互联网上。在海量网络 图像数据的检索过程中,如何在返回的检索结果集中去除复制的或者相 似的图像来提高检索的有效性具有重要的实际意义。例如在网络商品交 易平台中,用户通过自己发帖来进行物品的交换或买卖,在这种自由的 环境中,很多用户在发帖时使用的图像并不是符合自己物品的真实图像, 而是盗用别人的图像,这样就会对想买这个东西的人形成一定的欺骗。 另外,在很多实际应用中制作的图像具有商业用途,并受版权保护,该 类图像是被禁止随意拷贝和发布的。

现有的一种用于图像盗用识别的技术是采用数字签名方法。数字签 名方法是从图像中提取不变特征,然后生成摘要,并将摘要与图像捆绑 在一起。最为常用数字签名方法是根据图像内容生成Md5值,并将Md5 值作为图像的签名。然而,该类方法不能应对图像变换的影响,只要对 原图稍作修改,例如在图像中添加水印等,重新生成的图像就会有截然 不同的Md5值。所以该方法不能有效地检测相似图像。

现有的另外一种用于图像盗用识别的技术方法是采用基于内容的图 像复制检测方法,能够较准确地检索盗用的图像。该类方法根据图像的 内容生成一个指纹来检测待测图像是否为原图像的盗用。然而,若图像 库中指纹过多时,对相似图像的检索需要耗费大量时间,使得盗用图像 的检索效率较低。

因此,需要一种精准又高效的图像盗用识别方法。

发明内容

本发明的目的是提供一种生成图像指纹的方法,所述图像具有M行N 列像素,包括如下步骤:a)对所述图像中的每个像素点Xij,其中i=2,3,…… M,j=2,3,……N,比较所述像素点与其左像素及上像素的灰度值大小, 其中,左像素表示在所述一个像素的相邻的方位上下左右的四个像素中 左边的像素,上像素表示在所述一个像素的相邻的方位上下左右的四个 像素中上边的像素;b)根据不同的比较结果为所述像素点Xij赋予指纹值 Zij;c)将所述每个像素点的指纹值Zij组合为序列得到长度为(M-1)*(N-1) 的所述图像的指纹。

优选地,在所述步骤b中当“X≤A且X≤B”则赋予指纹值Zij=0;若 “X≤A且X>B”则赋予指纹值Zij=1;若“X>A且X≤B”则赋予指纹值 Zij=2;若“X>A且X>B”则赋予指纹值Zij=3,其中X表示所述像素点的 灰度值,A表示所述像素点左像素的灰度值,B表示所述像素点上像素的 灰度值。

根据本发明的另一个方面,提供了一种为图像生成指纹并存储的方 法,其特征在于,包括如下步骤:a)将所述图像缩放为统一大小;b)将所 述图像灰度化;c)生成图像指纹,生成所述图像指纹的方法如权利要求1 所述;d)对所述图像指纹进行两次分解,生成(n+1)(n+2)个指纹片段, 其中n代表任意两个指纹相似的图像汉明距离的差异值阈值;e)将所述指 纹片段存入信息搜索库,并建立所述指纹片段到所述图像指纹的倒排索 引。

优选地,在步骤b中,计算灰度值的公式为:

灰度值=0.3R+0.58G+0.11B    (1)

其中R、G、B分别为该像素的红色、绿色和蓝色像素值。

优选地,在所述步骤d中,对所述图像指纹进行两次分解的步骤包 括:d1)将所述图像指纹分解为n+1个指纹片段;和d2)将所述图像指纹 减去所述n+1个指纹片段中的每个指纹片段,并将与所述每个指纹片段 对应的每个所述图像指纹中的剩余的部分分解为n+1个片段。

优选地,在所述步骤e中,在所述指纹片段中添加业务类别号。

根据本发明的又一方面,提供了一种相似图像检索方法,包括如下 步骤:a)将所述图像缩放为统一大小;b)将所述图像灰度化;c)生成图像 指纹,生成所述图像指纹的方法如权利要求1所述;d)对所述图像指纹进 行两次分解,生成(n+1)(n+2)个指纹片段,其中n代表任意两个指纹 相似的图像汉明距离的差异值阈值;e)通过所述指纹片段的倒排索引,查 询具有相同所述指纹片段的图像指纹的结果集;和f)计算待检测图像指 纹与所述结果集中的图像指纹的汉明距离,在所述结果集中,找出与所 述待检测图像指纹的汉明距离小于n的图像指纹,将其作为相似图像。

优选地,在所述步骤d中,对所述图像指纹进行两次分解的步骤包 括:d1)将所述图像指纹分解为n+1个指纹片段;和d2)将所述图像指纹 减去所述n+1个指纹片段中的每个指纹片段,并将与所述每个指纹片段 对应的每个所述图像指纹中的剩余的部分分解为n+1个片段。

优选地,在所述步骤e中,通过所述指纹片段的倒排索引,查询具有 ai&&bij组合的指纹的结果集,其中,ai(i≥1&&i≤n+1)表示步骤d1中分解 得到的n+1个指纹片段中的任意一个,bij(i≥1&&i≤n+1,j≥1&&j≤n+1) 表示步骤d2中分解得到的n+1个指纹片段中的任意一个。

优选地,在所述步骤b中,计算灰度值的公式为:

灰度值=0.3R+0.58G+0.11B    (1)

其中R、G、B分别为该像素的红色、绿色和蓝色像素值。

利用本发明的图像盗用识别方法,能够精准而高效地识别相似图像, 防止图像盗用行为。

附图说明

参考随附的附图,本发明更多的目的、功能和优点将通过本发明实 施方式的如下描述得以阐明,其中:

图1示意性示出了本发明的为图像生成指纹并存储的方法的流程图。

图2示意性示出了本发明的相似图像检索的流程图。

具体实施方式

通过参考示范性实施例,本发明的目的和功能以及用于实现这些目 的和功能的方法将得以阐明。然而,本发明并不受限于以下所公开的示 范性实施例;可以通过不同形式来对其加以实现。说明书的实质仅仅是 帮助相关领域技术人员综合理解本发明的具体细节。

在下文中,将参考附图描述本发明的实施例。在附图中,相同的附 图标记代表相同或类似的部件,或者相同或类似的步骤。

本发明的图像盗用识别方法实现精准且高效的图像盗用识别的基本 方法如下:对于某图像,首先生成自定义的精准的图像指纹,然后求出 指纹的指纹片段,接着检索出具有相同指纹片段的指纹的结果集,最后 将该图像的图像指纹与结果集中的图像指纹进行比对来找出相似图像。

图1示意性示出了本发明的为图像生成指纹并存储的方法流程图。 如图1所示:

步骤110,将图像缩放为统一大小。将所有的图像统一缩放为M*N 的小图像。其中,M表示M行像素,N表示N列像素。例如将所有图像 缩放为10*9的小图像。

步骤120,将图像灰度化。图像的灰度化是将图像的每个像素点的 RGB值通过计算转化为一灰度值,用该灰度值来表示每个像素。优选地, 采用如下公式计算得到图像的每个像素的灰度值。

灰度值=0.3R+0.58G+0.11B    (1)

其中R、G、B分别表示该像素的红色、绿色和蓝色像素值。

步骤130,生成自定义的图像指纹。生成指纹的算法如下:

a)对于图像中的某个像素X,比较像素X与其左像素A的根据步骤 120计算得到的灰度值大小,以及像素X与其上像素B的灰度值大小, 可以得出四种不同的比较结果,即“X<A且X<B”、“X<A且X>B”、“X>A 且X<B”及“X>A且X>B”。其中,左像素表示在某个像素的相邻的方 位上下左右四个像素中左边的像素,上像素表示在某个像素的相邻的方 位上下左右四个像素中上边的像素。

b)根据比较结果对像素X赋予指纹值Z。这里,比较结果的赋值可 以是任何值,只要能够区分四种比较结果即可。例如,若“X≤A且X≤ B”则赋予指纹值Z=0;若“X≤A且X>B”则赋予指纹值Z=1;若“X>A 且X≤B”则赋予指纹值Z=2;若“X>A且X>B”则赋予指纹值Z=3;

c)对图像中的除了第一行和第一列以外所有的像素点执行步骤a及 步骤b的操作,将每个像素的指纹值Z组合为序列得到长度为(M-1)*(N-1) 的一系列的值的组合,即该图像的指纹。

步骤140,对图像指纹进行分解,生成多个指纹片段。

优选地,对图像指纹进行两次分解,生成多个指纹片段。若将两个 图像的汉明距离的差异值小于等于n(n可以为用户定义的值)的两个指 纹认为相似,则将指纹分解为指纹片段的算法如下所示:

a)将指纹L先分解为n+1个片段得到a1……an+1,即ai(i≥1&&i≤n+1); 其中,“分解”是指把图像指纹的(M-1)*(N-1)个值按顺序划分成若干个片 段。比如,对于图像的指纹{3,1,0,2,3,0,1,2,1,2,1,2},若将可以认为两个指 纹相似的图像汉明距离的差异值阈值N设定为3,则将该图像指纹分解为4 个片段,分别为{3,1,0},{2,3,0},{1,2,1}和{2,1,2}。

b)将总的指纹L减去每个片段ai之后剩余的部分分解为n+1片段得到 bi1……bin+1,即bij(i≥1&&i≤n+1,j≥1&&j≤n+1)。从而得到一个完整的 指纹的(n+1)(n+2)个指纹片段。

步骤150,将指纹片段存入信息搜索库,并建立指纹片段到指纹的倒 排索引。利用该倒排索引,可以直接通过某指纹片段找到包含该指纹片 段的指纹的结果集。

优选地,在每个图像片段中都添加业务类别号,从而在搜索时只需 在该业务类别的图像片段中进行相似性检索即可。具体地,信息搜索库 中存在所有业务的图像的片段,为了与业务结合,在每个图像片段中都 添加一个业务类别号,搜索时只需要在相关业务的图像片段内进行相似 性检索即可,例如,在进行房产类别的图片的相似性检索时,只需对含 有房产类别号的图像片段进行相似性检索即可。从而能够实现业务逻辑 与技术结合。

图2示意性示出了本发明的相似图像检索的流程图。如图2所示:

步骤210,将图像缩放为统一大小。将待检索的图像统一缩放为M*N 的小图像。

步骤220,将图像灰度化。优选采用0.3R+0.58G+0.11B计算得到图 像灰度值。

步骤230,生成自定义的图像指纹。具体算法如步骤130所述。

步骤240,对图像指纹进行分解,生成多个指纹片段。具体算法如步 骤140所述。

步骤250,查询具有相同指纹片段的指纹的结果集。通过指纹片段的 倒排索引找到具有相同指纹片段的指纹的结果集。

优选地,通过指纹片段的倒排索,查询具有ai&&bij组合的指纹的结 果集,即同时具有指纹片段ai(i≥1&&i≤n+1)以及指纹片段bij(i≥1&&i≤ n+1,j≥1&&j≤n+1)的指纹的结果集。

步骤260,计算与结果集中的指纹的汉明距离,找出相似图像。若汉 明距离小于可以认为两张图像相似的最大汉明距离的差异值n,则两张图 像相似。例如,若可以认为是相似图像的汉明距离的差异值的最大值n 为10,而图像A与结果集中的图像B的指纹的汉明距离为7,则图像A 与图像B相似。

利用本发明的图像盗用识别方法,能够精准而高效地识别相似图像, 防止图像盗用行为。

结合这里披露的本发明的说明和实践,本发明的其他实施例对于本 领域技术人员都是易于想到和理解的。说明和实施例仅被认为是示例性 的,本发明的真正范围和主旨均由权利要求所限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号