首页> 中国专利> 标签参数的提取方法和装置、存储介质、电子装置

标签参数的提取方法和装置、存储介质、电子装置

摘要

本申请公开了一种标签参数的提取方法和装置、存储介质、电子装置。其中,该方法包括:采集印刷标签的标签图像;采用像素横纵坐标区域生长扩散和关键特征概率统计的方式在所述标签图像中定位出标签所在的整体区域;通过对所述整体区域进行图像形态学处理、滤波处理以及轮廓区域提取的方法定位出标签中参数目标所在的具体区域;对所述具体区域中的参数目标进行字符分割,提取出标签参数。本申请解决了相关技术中提取标签目标参数的效率较低的技术问题。

著录项

  • 公开/公告号CN112183540A

    专利类型发明专利

  • 公开/公告日2021-01-05

    原文格式PDF

  • 申请/专利号CN202010975051.1

  • 申请日2020-09-16

  • 分类号G06K9/34(20060101);G06K9/20(20060101);G06K9/40(20060101);G06K9/46(20060101);G06F17/18(20060101);

  • 代理机构11372 北京聿宏知识产权代理有限公司;

  • 代理人吴大建;金淼

  • 地址 519000 广东省珠海市前山金鸡西路

  • 入库时间 2023-06-19 09:26:02

说明书

技术领域

本申请涉及人工智能领域,具体而言,涉及一种标签参数的提取方法和装置、存储介质、电子装置。

背景技术

随着人工智能技术的兴起,一系列需要人为操作的领域将用智能机器替代,使智能机器能胜任一些通常需要人类智能才能完成的复杂工作。在印刷标签识别方面,需要人工查看核对一些印刷标签的参数以确保印刷标签信息的准确性,这种人工查看的方式效率低,容易造成核对错误等情况,故需要采用智能机器识别的方式,准确识别印刷标签中的参数,替代人工核对。

印刷标签的参数区域主要包含数字、字母、汉字以及其他一些符号、图形等;其中数字、字母为印刷标签参数中的目标区域,印刷标签上的图形等是印刷标签的说明部分,不涉及参数确认,由于印刷标签区域内容复杂,故准确提取目标区域是智能机器准确识别参数的重要部分,而目前还没有相关方案能够实现,只能人工核验,效率较低。

针对上述的问题,目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种标签参数的提取方法和装置、存储介质、电子装置,以至少解决相关技术中提取标签目标参数的效率较低的技术问题。

根据本申请实施例的一个方面,提供了一种标签参数的提取方法,包括:采集印刷标签的标签图像;采用像素横纵坐标区域生长扩散和关键特征概率统计的方式在所述标签图像中定位出标签所在的整体区域;通过对所述整体区域进行图像形态学处理、滤波处理以及轮廓区域提取的方法定位出标签中参数目标所在的具体区域;对所述具体区域中的参数目标进行字符分割,提取出标签参数。

根据本申请实施例的另一方面,还提供了一种标签参数的提取装置,包括:采集单元,用于采集印刷标签的标签图像;第一定位单元,用于采用像素横纵坐标区域生长扩散和关键特征概率统计的方式在所述标签图像中定位出标签所在的整体区域;第二定位单元,用于通过对所述整体区域进行图像形态学处理、滤波处理以及轮廓区域提取的方法定位出标签中参数目标所在的具体区域;提取单元,用于对所述具体区域中的参数目标进行字符分割,提取出标签参数。

根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的方法。

根据本申请实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器通过计算机程序执行上述的方法。

印刷标签图像信息复杂,干扰信息较多,采用本申请的技术方案,可提取印刷标签的目标区域,准确获取印刷标签中参数目标。采用像素横纵坐标区域生长扩散、关键特征概率统计的方式获取目标所在的整体区域,再通过图像形态学处理、轮廓提取的方法提取具体的目标区域(即具体区域),为后续的参数识别提供前提条件,剔除其他非参数型图像的干扰,能够更加有效准确的提取参数目标区域,为实现参数准确识别,实现参数信息核对提供必要的前提条件,可以解决相关技术中提取标签目标参数的效率较低的技术问题,能够代替人工查找检测,提高核对准确率。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是根据本申请实施例的一种可选的标签参数的提取方法的流程图;

图2是根据本申请实施例的一种可选的标签参数的提取方法的流程图;

图3是根据本申请实施例的一种可选的标签参数的提取方法的流程图;

图4是根据本申请实施例的一种可选的标签参数的提取装置的示意图;

以及

图5是根据本申请实施例的一种终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本申请实施例的一方面,提供了一种标签参数的提取方法的方法实施例。图1是根据本申请实施例的一种可选的标签参数的提取方法的流程图,如图1所示,该方法可以包括以下步骤:

步骤S102,采集印刷标签的标签图像。

在上述方案中,在采用像素横纵坐标区域生长扩散和关键特征概率统计的方式在标签图像中定位出标签所在的整体区域之前,可对标签图像进行灰度化处理,并采用高斯核对灰度图像进行滤波,去除灰度图像中的图像噪声,然后利用阈值t将灰度图像进行二值化,得到提升了对比度的灰度图像(即第三灰度图像)。

可选地,按照如下方式确定阈值t:

q

q

μ

μ

步骤S104,采用像素横纵坐标区域生长扩散和关键特征概率统计的方式在标签图像中定位出标签所在的整体区域。

可选地,采用像素横纵坐标区域生长扩散和关键特征概率统计的方式在标签图像中定位出标签所在的整体区域时,可采用轮廓查找的方式定位出灰度图像中的二值化图像轮廓,将二值化图像轮廓中大于阈值T1的作为有效区域;通过字符识别模型识别出有效区域中的字符区域;以字符区域作为区域扩散基本点进行区域扩散;在扩散后的区域内字符区域的占比开始下降时停止扩散,并提取扩散后的区域作为整体区域。

步骤S106,通过对整体区域进行图像形态学处理、滤波处理以及轮廓区域提取的方法定位出标签中参数目标所在的具体区域。

可选地,通过对整体区域进行图像形态学处理、滤波处理以及轮廓区域提取的方法定位出标签中参数目标所在的具体区域包括:对整体区域的区域图像进行灰度化,并通过高斯滤波去除噪点,得到灰度图像;对灰度图像进行二值化处理,在灰度图像中进行轮廓查找,并通过阈值T2从查找到的轮廓区域中提取字符块所在的具体区域。

步骤S108,对具体区域中的参数目标进行字符分割,提取出标签参数。

可选地,对具体区域中的参数目标进行字符分割,提取出标签参数包括:对所述具体区域进行水平方向和垂直方向投影,将有像素存在的区域作为字符区域,通过像素与空间阈值进行分割,先按水平投影分割出字符行,然后对字符行进行垂直投影,分割出单个标签参数字符。

印刷标签图像信息复杂,干扰信息较多,采用本申请的技术方案,可提取印刷标签的目标区域,准确获取印刷标签中参数目标。采用像素横纵坐标区域生长扩散、关键特征概率统计的方式获取目标所在的整体区域,再通过图像形态学处理、轮廓提取的方法提取具体的目标区域(即具体区域),为后续的参数识别提供前提条件,剔除其他非参数型图像的干扰,能够更加有效准确的提取参数目标区域,为实现参数准确识别,实现参数信息核对提供必要的前提条件,可以解决相关技术中提取标签目标参数的效率较低的技术问题,能够代替人工查找检测,提高核对准确率。

作为一种可选的实施例,下文结合图3所示的具体的实施方式详述本申请的技术方案。

本方案针对印刷标签检测中参数识别时,信息复杂、干扰信息繁多导致的无法准确获取目标区域的问题,提出一种基于图像处理的印刷标签目标区域提取方法,如图2所示,本方法主要采用像素横纵坐标区域生长扩散、关键特征概率统计的方式获取目标所在的整体区域,再通过图像形态学、滤波处理、轮廓提取的方法提取具体的目标区域(即具体区域),有效提取参数所在区域,为参数识别检测提供前提条件。该方法包括以下步骤:

步骤1,印刷标签图片预处理,其实施原理为对输入的彩色图像(如图像尺寸为2592*2048*3)进行灰度化处理得到灰度图像(图像尺寸为 2592*2048),对灰度图像实施低通滤波LPF(Low-pass filter),如采用3*3 的高斯核对图像进行滤波,去除图像噪声;采用最大类间方差法(Otsu’ s法),自动找到一个阈值t,使得类间方差最大,满足下列关系式:

假设一幅图像有L个灰度级[1,2,…,L]。灰度级为i的像素点的个数为n

其中P

采用遍历的方法得到使类间方差

步骤2,提取整体目标区域(利用像素横纵坐标区域生长扩散、关键特征概率统计的方式提取整体目标区域);通过轮廓提取的方式提取二值化图像轮廓,对于轮廓区域大于阈值T1(如阈值T1设为500)的区域作为有效区域,此时的待定有效区域信息包含单独有效区域,以及区域在原图中的坐标信息,通过字符识别模型对有效区域进行识别,定位识别出的数字或字母区域。

利用像素坐标扩散的方法,取一个区域作为扩散的起始点,如以8连域横纵坐标生长扩散的方式不断将该区域扩大,采用关键特征概率统计的方式,以区域比的方式统计扩宽后的区域内数字或字母的区域占扩宽后区域的比例

步骤3,字符块提取,从原图中提取字符块区域后,对提取出来的区域进行灰度化,通过高斯模糊去除噪点,采用Otsu’s二值化的方式处理整体目标区域图像,再进行轮廓提取,对轮廓区域按面积进行提取,提取区域的面积阈值T2设为3000;此时能有效提取数字或字母块,即为字符块区域。

步骤4,对提取的数字或字母块进行处理,形成单个字符,作为字符识别模型的输入;将提取的图像块进行水平方向和垂直方向投影,有像素存在的区域即为字符区域,通过像素与空间阈值进行分割;先按水平投影分割出字符行,然后对字符行进行垂直投影,分割出单个字符,所有分割出的单个字符即为最终的目标区域。

步骤2、3、4中设定的阈值可根据实际情况调整。本实施例中的阈值 T1、T2的设定是根据实际实施例选取的值。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如 ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。

根据本申请实施例的另一个方面,还提供了一种用于实施上述标签参数的提取方法的标签参数的提取装置。图4是根据本申请实施例的一种可选的标签参数的提取装置的示意图,如图4所示,该装置可以包括:

采集单元401,用于采集印刷标签的标签图像。

可选地,采集单元还用于,在采用像素横纵坐标区域生长扩散和关键特征概率统计的方式在标签图像中定位出标签所在的整体区域之前,可对标签图像进行灰度化处理,并采用高斯核对灰度图像进行滤波,去除灰度图像中的图像噪声,然后利用阈值t将灰度图像进行二值化,得到提升了对比度的灰度图像。

可选地,按照如下方式确定阈值t:

q

q

μ

μ

第一定位单元403,用于采用像素横纵坐标区域生长扩散和关键特征概率统计的方式在所述标签图像中定位出标签所在的整体区域;

可选地,第一定位单元还用于采用像素横纵坐标区域生长扩散和关键特征概率统计的方式在标签图像中定位出标签所在的整体区域时,采用轮廓查找的方式定位出灰度图像中的二值化图像轮廓,将二值化图像轮廓中大于阈值T1的作为有效区域;通过字符识别模型识别出有效区域中的字符区域;以字符区域作为区域扩散基本点进行区域扩散;在扩散后的区域内字符区域的占比开始下降时停止扩散,并提取扩散后的区域作为整体区域。

第二定位单元405,用于通过对所述整体区域进行图像形态学处理、滤波处理以及轮廓区域提取的方法定位出标签中参数目标所在的具体区域。

可选地,第二定位单元还用于:对整体区域的区域图像进行灰度化,并通过高斯滤波去除噪点,得到灰度图像;对灰度图像进行二值化处理,在灰度图像中进行轮廓查找,并通过阈值T2从查找到的轮廓区域中提取字符块所在的具体区域。

提取单元407,用于对所述具体区域中的参数目标进行字符分割,提取出标签参数。

可选地,提取单元还用于:对所述具体区域进行水平方向和垂直方向投影,将有像素存在的区域作为字符区域,通过像素与空间阈值进行分割,先按水平投影分割出字符行,然后对字符行进行垂直投影,分割出单个标签参数字符。

需要说明的是,该实施例中的采集单元401可以用于执行本申请实施例中的步骤S102,该实施例中的第一定位单元403可以用于执行本申请实施例中的步骤S104,该实施例中的第二定位单元405可以用于执行本申请实施例中的步骤S106,该实施例中的提取单元407可以用于执行本申请实施例中的步骤S108。

此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行相应的硬件环境中,可以通过软件实现,也可以通过硬件实现。

通过上述模块,可提取印刷标签的目标区域,准确获取印刷标签中参数目标。采用像素横纵坐标区域生长扩散、关键特征概率统计的方式获取目标所在的整体区域,再通过图像形态学处理、轮廓提取的方法提取具体的目标区域(即具体区域),为后续的参数识别提供前提条件,剔除其他非参数型图像的干扰,能够更加有效准确的提取参数目标区域,为实现参数准确识别,实现参数信息核对提供必要的前提条件,可以解决相关技术中提取标签目标参数的效率较低的技术问题,能够代替人工查找检测,提高核对准确率。

此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在相应的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。

根据本申请实施例的另一个方面,还提供了一种用于实施上述标签参数的提取方法的服务器或终端。

图5是根据本申请实施例的一种终端的结构框图,如图5所示,该终端可以包括:一个或多个(图5中仅示出一个)处理器201、存储器203、以及传输装置205,如图5所示,该终端还可以包括输入输出设备207。

其中,存储器203可用于存储软件程序以及模块,如本申请实施例中的标签参数的提取方法和装置对应的程序指令/模块,处理器201通过运行存储在存储器203内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的标签参数的提取方法。存储器203可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器203可进一步包括相对于处理器201远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

上述的传输装置205用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置205包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置205为射频 (Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。

其中,具体地,存储器203用于存储应用程序。

处理器201可以通过传输装置205调用存储器203存储的应用程序,以执行下述步骤:

采集印刷标签的标签图像;

采用像素横纵坐标区域生长扩散和关键特征概率统计的方式在所述标签图像中定位出标签所在的整体区域;

通过对所述整体区域进行图像形态学处理、滤波处理以及轮廓区域提取的方法定位出标签中参数目标所在的具体区域;

对所述具体区域中的参数目标进行字符分割,提取出标签参数。

处理器201还用于执行下述步骤:

对所述标签图像进行灰度化处理,得到第一灰度图像;

采用高斯核对所述第一灰度图像进行滤波,去除所述第一灰度图像中的图像噪声,得到第二灰度图像;

利用第一阈值将所述第二灰度图像进行二值化,得到提升了对比度的第三灰度图像。

印刷标签图像信息复杂,干扰信息较多,采用本申请的技术方案,可提取印刷标签的目标区域,准确获取印刷标签中参数目标。采用像素横纵坐标区域生长扩散、关键特征概率统计的方式获取目标所在的整体区域,再通过图像形态学处理、轮廓提取的方法提取具体的目标区域(即具体区域),为后续的参数识别提供前提条件,剔除其他非参数型图像的干扰,能够更加有效准确的提取参数目标区域,为实现参数准确识别,实现参数信息核对提供必要的前提条件,可以解决相关技术中提取标签目标参数的效率较低的技术问题,能够代替人工查找检测,提高核对准确率。

可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。

本领域普通技术人员可以理解,图5所示的结构仅为示意,终端可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile InternetDevices,MID)、PAD等终端设备。图5 其并不对上述电子装置的结构造成限定。例如,终端还可包括比图5中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图5所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器 (Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。

本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行标签参数的提取方法的程序代码。

可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。

可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:

采集印刷标签的标签图像;

采用像素横纵坐标区域生长扩散和关键特征概率统计的方式在所述标签图像中定位出标签所在的整体区域;

通过对所述整体区域进行图像形态学处理、滤波处理以及轮廓区域提取的方法定位出标签中参数目标所在的具体区域;

对所述具体区域中的参数目标进行字符分割,提取出标签参数。

可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:

对所述标签图像进行灰度化处理,得到第一灰度图像;

采用高斯核对所述第一灰度图像进行滤波,去除所述第一灰度图像中的图像噪声,得到第二灰度图像;

利用第一阈值将所述第二灰度图像进行二值化,得到提升了对比度的第三灰度图像。

可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。

可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号