首页> 中国专利> 一种基于数字图像内容的图书检索方法

一种基于数字图像内容的图书检索方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种基于数字图像内容的图书检索方法，包括以下步骤:将选取出的样本图书图像进行分辨率归一化操作，并进行多特征层面的图像描述，然后对每种图书进行学习训练，以此得到不同的训练识别模型；将获取的待检索图书图像矫正为矩形,然后对其进行分辨率归一化操作,在获取出相应的图像后对其进行多特征层面的图像描述，将特征数据输入训练识别模型中进行初始结果的预测；在得到初始预测结果后，分别判断最大可能的两类结果与其判别中心的高斯分布，概率值最高的那一类，确定为最终的检索结果。本发明充分利用图像的底层特征特性并通过自动学习与模型概率判别策略，提高了检索准确率，可以进行大规模的基于数字图像的图书检索工作。

著录项

公开/公告号CN105404682A

专利类型发明专利
公开/公告日2016-03-16

原文格式PDF
申请/专利权人北京卓视智通科技有限责任公司;公绪超;
展开▼

申请/专利号CN201510849994.9
发明设计人公绪超;吴柯维;郭长全;
展开▼

申请日2015-11-29
分类号G06F17/30;
代理机构
代理人
地址 100088 北京市海淀区清河小营桥北青尚办公区327室
入库时间 2023-12-18 14:50:10

法律信息

法律状态公告日

法律状态信息

法律状态
2019-06-18

授权

授权
2016-08-31

实质审查的生效 IPC(主分类):G06F17/30 申请日:20151129

实质审查的生效
2016-03-16

公开

公开

说明书

技术领域

本发明属于计算机视觉领域，是图像检索领域中的一项重要应用，尤其是涉及一种基于数字图像内容的图书检索方法。

背景技术

模糊C均值聚类算法是一种自适应聚类学习算法，它能够根据不同类别的输入训练样本特征值自动计算出对应的特征中心，从而为后续的识别与检测工作提供可靠的先验知识。这种方法的优点是，在样本特征表征全面且样本量充足的条件下能够进行很好的分类工作，同时对于不良数据的容忍力较强，可以适应多种不同的数据环境。因此该算法广泛应用于数据挖掘、图像分类、图像检索、图像物体识别、视频对象跟踪等多个图像处理领域。近年来伴随数据量的不断增加，该技术的应用在一定程度上推动了计算机视觉技术的发展。

基于图像的图书检索是图像检索的一项重要应用。一方面它可以根据图像快速的检索出对应的图书信息，从而免去了人工手动输入文字查询图书信息的环节；另一方面通过图像检索大大简化了信息查找的难度，完成了所见即所得的查找模式。

目前有一些有关基于图像的图书检索方面的研究，也出现了一些相应的方法，其中相当多的方法都用到了图像特征和先验学习。从基于图像的图书检索技术角度来分，大致可以分为两大类：基于图像特征描述的图书图像检索和基于信息标注的图书图像检索，本文关注的重点在于前者。总体来说，基于信息标注的图书图像检索，由于会受到标注信息不准，标注信息不全面不能有效地满足各类识别情况等影响，使得该类方法的识别容易受到影响，并且适应的环境也相对局限，不具有有效地进行一对一检索，此外由于信息标注工作量大维护困难，所以该方法在一定程度上受到了应用限制。相对来讲基于图像特征的方法准确率较高，图像的多特征描述能够有效的分析图书的边缘、颜色、角点等信息，再通过聚类分析能够在训练样本足够大的情况下找到不同图书之间的分界线，此外该类方法对于无关数据的干扰有较强的容忍度，能够适应较多的识别场景。但是基于训练学习的方法需要选取全面描述图像的特征以充分的获取分类面，另外，对于不同聚类学习算法的输出需要寻找一种合适的结果获取规则进行最终结果的获取。

伴随图形图像专业方向的不断发展，图像检索的功能会越来越完善，对于图书图像检索要求会越来越高，但是检索识别的环境却越来越复杂。因此制定出一种可靠、鲁棒的图书检索识别算法是十分有必要的。

发明内容

本发明的目的在于针对现有技术存在的不足，提出了一种基于数字图像内容的图书检索方法。该方法以描述图书图像的多种特征为基础，融入了聚类学习与概率分布确立的思想，充分提高了图书检索的效率，可以有效地进行不同场景下的图书图像检索识别，对于图像检索系统是有积极意义的。

为实现上述目的,本发明公开了一种基于数字图像内容的图书检索方法,该方法包括以下步骤:

将选取出的样本图书图像进行分辨率归一化操作，并进行多特征层面的图像描述，然后对每种图书进行学习训练，以此得到不同的训练识别模型；

将获取的待检索图书图像矫正为矩形,然后对其进行分辨率归一化,在获取出相应的图像后对其进行多特征层面的图像描述，将特征数据输入所述训练识别模型中进行初始结果的预测；所述预测结果中包含当前待检索图书最大可能的前两种结果；

在得到初始预测结果后，分别判断最大可能的两类结果与其判别中心的高斯分布，概率值最高的那一类，确定为最终的检索结果。

优选地,多特征层面的图像描述包括:描述图书图像整体颜色分布的颜色矩特征、描述整幅图像边缘的边缘直方图特征和用于描述图书图像角点的角点特征中的一种或多种；

优选地,样本图书图像在进行图书图像特征提取时全部进行分辨率归一化操作。

优选地,样本图书图像在进行颜色矩特征提取时，在分辨率归一化操作结束后,先进行伽马滤波，接着将样本图书图像分解成有交叠的图像区块，其中每两个相邻的图像区块重叠率是其面积的0.3到0.5倍，然后计算图像中相应区块的颜色特征值，最后统计输出整幅图像的颜色信息。

优选地,样本图书图像在进行颜色矩特征提取时，首先对样本图书图像进行分块处理。

优选地,样本图书图像在进行角点特征提取时，在分辨率归一化操作结束后对彩色图像进行灰度化处理。

优选地,样本图书图像在进行边缘直方图特征提取时，在分辨率归一化操作结束后对彩色图像中的每个颜色通道图像都进行高斯滤波，将图像分解成有交叠的图像区块，其中每两个相邻的图像区块重叠率是其面积的0.3到0.5倍，然后在每个图像区块中统计图像在 360度范围内的梯度分布情况，最后统计输出整幅图像的边缘信息描述值。

优选地,在得到描述图像的各类特征后，用模糊C均值聚类算法对样本特征进行聚类学习，在训练学习之前要对所选样本特征数据进行合并以得到整体的训练学习参数。

优选地,进行初始结果的预测步骤包括:

在计算获得初始结果前,按照树的广度优先策略进行中心遍历并计算相似度，最后相似度最大的两类被作为初始候选结果。

优选地,训练识别模型是通过基于聚类思想的学习算法，对每种图书进行学习训练后获取。

本发明能够全面的描述图像的颜色、角点和边缘信息，特征数据聚类技术能够对无关数据的干扰有较强的容忍度，并且能够适应多种识别场景。在获得初始预测结果后为精确的融合结果采用了高斯概率判别理论，有效的提高了图书检索的准确率。

附图说明

图1为本发明实施例提供的一种基于数字图像内容的图书检索方法流程示意图；

图2为本发明实施例提供的颜色矩特征提取方法流程示意框图；

图3为本发明实施例提供的边缘直方图特征提取方法流程示意框图；

图4为本发明实施例提供的角点特征提取方法流程示意框图。

具体实施方式

结合附图，本发明实施例的基本思想是针对图书图像检索的实际情况，将整个识别工作分为三个部分。在进行图书图像检索之前，首先对图书图像进行矩形矫正、归一化再进行一系列特征提取以及基于聚类思想的学习与训练，以得到图书图像库的特征聚类中心；然后在识别阶段根据得到的待检索图书图像再进矩形矫正、行归一化与特征提取，将所得特征放入图书图像库模型中得到初始结果；最后再根据高斯概率分布理论对初始结果进行融合以得到最后的检索结果。以上方法可以适应多种识别场景，并在相当的程度上提高了识别精度。

图1为本发明实施例提供的一种基于数字图像内容的图书检索方法流程示意框图。如图1所示,该方法包括步骤101-103:

在步骤101、将选取出的样本图书图像进行分辨率归一化操作，并进行多特征层面的图像描述，然后对每种图书进行学习训练，以此得到不同的训练识别模型。

具体地,在图书图像检索的学习训练阶段，首先对相应的样本图书图像进行矩形矫正、分辨率归一化操作，再提取描述图像整体边缘信息的边缘直方图特征(提取方法流程图如图2所示)、描述图像颜色信息的颜色矩特征(提取方法流程图如图3所示)和用于描述图像角点的角点特征(提取方法流程图如图4所示)，然后通过基于聚类思想的学习算法进行归类学习，旨在为后续的具体识别过程提供良好的判别识别模型。

优选地，样本图书图像在进行多类特征提取时，分辨率按照图像的原始尺度，归一化为合适的大小；样本图书像在进行颜色特征提取时，在分辨率归一化结束后要先进行伽马滤波，接着将图像分解成有交叠的图像区块，其中每两个相邻的图像区块重叠率是其面积的0.3到0.5倍，以抵抗由图像的旋转平移对检索造成的影响，然后计算图像中相应区块的颜色特征值，最后统计输出整幅图像的颜色信息；样本图书图像在进行边缘特征提取时，在分辨率归一化结束后要对彩色图像中的每个颜色通道图像都进行高斯滤波，这样做的目的是减少由高斯噪声带来的边缘描述误差。在这个环节同样将图像分解成有交叠的图像区块，其中每两个相邻的图像区块重叠率是其面积的0.3到0.5倍，然后在每个图像区块中统计图像在360度范围内的梯度分布情况，最后统计输出整幅图像的边缘信息描述值；样本图书图像在进行角点特征提取时，为了提高运算速度在图像归一化后要对其进行灰度化处理；在进行角点特征提取时，在分辨率归一化操作结束后对彩色图像进行灰度化处理。

作为本发明实施例的一种改进，本发明实施例在得到描述图像的各类特征后，用模糊C 均值聚类算法对样本特征进行聚类学习，在训练学习之前要对所选样本特征数据进行合并以得到整体的训练学习参数。通过模糊C均值聚类思想的学习算法，对每种图书进行学习训练，获得不同的训练识别模型。

在步骤102、将获取的待检索图书图像矫正为矩形,然后对其进行分辨率归一化操作, 在获取出相应的图像后对其进行多特征层面的图像描述，将特征数据输入所述训练识别模型中进行初始结果的预测；所述预测结果中包含当前待检索图书最大可能的前两种结果。

具体地，在图书图像检索的检索识别阶段，首先，根据相应的矩形矫正算法将拍摄得到的不规则图书进行矩形矫正，然后对其进行分辨率归一化，再提取相应的颜色矩特征、边缘直方图特征和角点特征，最后将这些特征数据输入识别模型中进初始结果的预测；预测结果中包含当前待检测图书图像的最高前两类结果，用来缩小相应的图书图像的识别范围。

优选地，本发明实施例在计算获得初始结果前,按照树的广度优先策略进行中心遍历并计算相似度，最后相似度最大的两类被作为初始候选结果。

在步骤103、在得到初始预测结果后，分别判断最大可能的两类结果与其判别中心的高斯分布，概率值最高的那一类，确定为最终的检索结果。

具体地，在最终检索结果判别的过程中，首先根据输入样本的特征属性，通过高斯概率分布方法融合判别当前样本在各类中的概率值，最终得到预测结果的准确输出，其中相应的图书信息是概率结果预测值最大的那一个。

在这一过程中要求图书图像较为清晰并且图书所占的面积应该较大，这对有效的进行图书检索是非常必要的。在用特征判别时考虑到算法的运算性能采用的是基于中心树的广度优先搜索方法。在最后的结果判别中应当使用结果的概率输出方法。

优选地，本发明实施例在得到初始结果时，需要按照广度优先搜索的方法进行相似度测量；在得到初始结果后在高斯概率分布的条件下，对其进行概率判别以得到最终的结果。

本发明实施例在图像特征提取的基础上，把图像处理领域中应用非常广泛的图像底层特征、聚类思想和概率预测方法有效地结合在了一起。第一部分的训练学习可以根据所选的图书样本图像获得识别模型。在识别阶段，根据具体获得的初始预测结果进行基于概率判别方法的结果融合，直至得到最终结果。

本发明能在保障完成基本识别功能的前提下，结构简单，复杂度低，算法效率高，适合在图书检索系统中应用。

显而易见，在不偏离本发明的真实精神和范围的前提下，在此描述的本发明可以有许多变化。因此，所有对于本领域技术人员来说显而易见的改变，都应包括在本权利要求书所涵盖的范围之内。本发明所要求保护的范围仅由所述的权利要求书进行限定。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于数字图像内容的图书检索方法 [P] . 中国专利： CN105404682B . 2019.06.18
2. 一种基于深度哈希学习的菊花图像内容检索方法 [P] . 中国专利： CN108932314A . 2018-12-04
3. METHOD FOR INDEXING AND RETRIEVING MANUFACTURING-SPECIFIC DIGITAL IMAGERY BASED ON IMAGE CONTENT [P] . 世界知识产权组织专利： WO0122270A3 . 2003-12-24

机译：基于图像内容的制造专用数字影像的检索与检索方法
4. METHOD FOR INDEXING AND RETRIEVING MANUFACTURING-SPECIFIC DIGITAL IMAGERY BASED ON IMAGE CONTENT [P] . 世界知识产权组织专利： WO0122270A2 . 2001-03-29

机译：基于图像内容的制造专用数字影像的检索与检索方法
5. An information retrieval method based-on semantic knowledge structures for learners using books' contents and index and the system thereof [P] . 韩国专利： KR101697167B1 . 2017-01-18

机译：一种基于语义知识结构的图书内容和索引学习者信息检索方法及其系统