首页> 中国专利> 用于识别一个或多个字符的设备和方法

用于识别一个或多个字符的设备和方法

摘要

提供了一种用于识别一个或多个字符的设备。所述设备包括调整单元(12),用于调整对象的第一图像的颜色水平以生成经调整图像,所述对象的所述第一图像是从对象的彩色图像生成的,所述对象的所述彩色图像包括要被识别的一个或多个字符;转换单元(13),用于将所述经调整图像转换成二值图像;以及字符识别单元(14),用于基于所述二值图像识别所述一个或多个字符。通过该设备,可以从具有多种颜色信息、尤其是具有背景颜色信息的图像准确地识别一个或多个字符。

著录项

  • 公开/公告号CN113196293A

    专利类型发明专利

  • 公开/公告日2021-07-30

    原文格式PDF

  • 申请/专利号CN201880098908.7

  • 发明设计人 范宇颖;

    申请日2018-10-16

  • 分类号G06K9/20(20060101);

  • 代理机构72002 永新专利商标代理有限公司;

  • 代理人李光颖

  • 地址 德国巴德宏堡

  • 入库时间 2023-06-19 12:02:28

说明书

技术领域

本发明通常涉及光学字符识别,并且具体涉及从彩色图像识别一个或多个字符。

背景技术

在一些情况下,参数被测量并且以不同的前景颜色和背景颜色被显示给用户。这在医学领域中尤其是常见的。例如,对于透析机,可以在具有灰色背景颜色的区域中以不同的颜色(例如蓝色和/或绿色)示出各参数,并且对于床旁监护仪,可以在具有黑色背景颜色的区域中以不同的颜色(例如绿色和/或红色)示出各参数。

在一些应用中,尤其是在医学应用中,用户(例如医师或护理者)会需要记录参数。然而,一些医学设备(诸如一些相对便宜的医学设备)只可以将测量的参数显示给用户,但是没有可以以电子方式输出并记录测量的参数的输出接口。在这种情况下,用户只可以用笔通过手写来记录参数。当用户需要长时间监测并记录患者的某一个(某些)参数时,这样的参数记录是易于出错的且耗时的。

光学字符识别(OCR)技术可以用于从医学设备的显示识别一个或多个字符,然而,由于医学设备的显示中的多种颜色信息,尤其是医学设备的显示中的背景颜色信息,字符的识别可能是不准确的。

发明内容

因此,提供可以从具有多种颜色信息、尤其是具有背景颜色信息的图像中自动地识别一个或多个字符的方法和设备将会是期望的,以促进对显示器中示出的参数的记录。

在一个方面中,本发明的一个实施例提供了一种用于识别一个或多个字符的设备。所述设备包括调整单元,用于调整对象的第一图像的颜色水平以生成经调整图像,所述对象的所述第一图像是从对象的彩色图像生成的,所述对象的所述彩色图像包括要被识别的一个或多个字符;转换单元,用于将所述经调整图像转换成二值图像;以及字符识别单元,用于基于所述二值图像识别所述一个或多个字符。

一般来说,为了执行OCR,首先应当将图像转换成二值图像。图像的多种颜色信息(包括背景颜色信息和前景颜色信息)可以在转换之后将噪声引入二值图像中,并且进一步不利地影响OCR结果。例如,具有背景颜色的一些区域可以被转换成二值图像中的黑色区域,就像字符一样,以致于干扰字符的识别,并且因此不能从具有多种颜色信息的彩色图像准确地识别字符。

根据本发明的设备,在将彩色图像转换成二值图像以对图像中的字符执行OCR之前首先调整彩色图像的颜色水平。这样一来,可以从具有多种颜色信息、尤其是具有背景颜色信息的图像准确地识别一个或多个字符。

根据一个实施例,所述调整单元调整所述对象的所述彩色图像的亮度以生成所述对象的所述第一图像。因此,在调整颜色水平之前,首先调整彩色图像的亮度,由此可以去除一部分背景颜色。

根据另一实施例,所述调整单元调整所述对象的所述彩色图像的对比度以生成所述对象的中间彩色图像,并且然后调整所述对象的所述中间彩色图像的所述亮度以生成所述对象的所述第一图像。以这种方式,首先调整彩色图像的对比度,并且因此,可以克服彩色图像中的过度曝光和/或曝光不足。

根据另一实施例,所述调整单元锐化所述对象的所述第一图像,并且然后调整所述对象的经锐化的第一图像的颜色水平以生成所述经调整图像。以这种方式,在鉴于颜色水平进行调整之前锐化图像,可以去除图像中的噪声。

根据另一实施例,所述设备进一步包括识别单元,用于从初始彩色图像识别感兴趣区域作为所述对象,所述感兴趣区域示出要被识别的一个或多个字符;并且从所述初始彩色图像确定指示所述感兴趣区域的图像数据以生成所述对象的所述彩色图像。根据该实施例,从初始彩色图像确定感兴趣区域,并且可以对仅感兴趣区域的彩色图像执行所有后续处理。

根据又一实施例,所述设备进一步包括比较单元,用于比较所述初始彩色图像与一个或多个预定模板,所述一个或多个预定模板指示示出所述对象的感兴趣图像,其中,如果所述初始彩色图像对应所述一个或多个预定模板,所述识别单元从所述初始彩色图像识别所述感兴趣区域作为所述对象。

根据又一实施例,所述设备进一步包括比较单元,用于比较所述对象的所述彩色图像与一个或多个预定模板,所述一个或多个预定模板指示所述对象的感兴趣图像,其中,如果所述对象的所述彩色图像对应所述一个或多个预定模板,从所述对象的所述彩色图像生成所述对象的所述第一图像。

根据上面两个实施例,仅对应于预定模板的彩色图像或初始彩色图像可以被根据本发明的实施例来处理。因此,可以首先检查彩色图像的有效性,并且可以抛弃无效的图像。以这种方式,本发明的设备可以被设计为处理指定种类的图像。

在另一方面中,本发明的一个实施例提供一种用于识别一个或多个字符的方法。所述方法包括调整对象的第一图像的颜色水平以生成经调整图像,所述对象的所述第一图像从对象的彩色图像生成并且包括要被识别的一个或多个字符;将所述经调整图像转换成二值图像;以及基于所述二值图像识别所述一个或多个字符。

在另外的方面中,本发明的实施例提供一种被配置为执行根据本发明的实施例的方法的图像处理器;一种成像系统,包括用于识别一个或多个字符的设备或被配置为执行根据本发明的实施例的方法的图像处理器;以及一种机器可读存储介质,被编码有用于在被执行时执行根据本发明的实施例的方法的指令。

本公开的各个方面和特征在下面更详细地进行描述。并且,参考结合附图给出的描述,本发明的其他目的和优点将变得更加显而易见并且将容易被理解。

附图说明

本发明将会在下文中结合实施例并且参考附图更详细地进行描述和解释,其中:

图1示出了根据本发明的一个实施例的用于从彩色图像识别一个或多个字符的系统10;

图2是根据本发明的一个实施例图示了调整彩色图像的对比度的流程图100;

图3是根据本发明的一个实施例图示了调整彩色图像的亮度的流程图200;

图4是根据本发明的一个实施例图示了彩色图像的反锐化掩膜(USM)锐化的流程图300;

图5是根据本发明的一个实施例图示了调整彩色图像的颜色水平的流程图400;

图6是根据本发明的一个实施例图示了基于包括要被识别的字符的二值图像的光学字符识别程序的流程图500;

图7示出了根据本发明的另一实施例的用于从彩色图像识别一个或多个字符的系统20;

图8是根据本发明的一个实施例图示了从初始图像识别感兴趣区域的流程图;以及

图9是根据本发明的一个实施例的用于从彩色图像识别一个或多个字符的方法的流程图。

附图中的相同参考标记指示类似的或对应的特征和/或功能。

本发明将会关于具体实施例并且参考某些附图而被描述,但是本发明不限于此,而是仅由权利要求进行限制。所描述的附图仅是示意性的,并且是非限制性的。在附图中,为了图示性目的,一些元件的尺寸可以被夸大,并不按比例进行绘制。

具体实施方式

在下文中将会关于医学应用、尤其是透析机(诸如费森尤斯的4008A和高级透析机)描述本发明。然而,应当注意,本发明的设备和方法也可以被用于其他领域中和用于其他图像,只要这些图像具有多种颜色信息、尤其是背景颜色信息即可,并且存在自动地记录参数的需要,但是设备可能不能提供这样的接口来以电子方式记录参数。

在费森尤斯的4008A透析机中,在透析期间,在显示器中以多种颜色信息显示透析参数,例如,背景颜色可以是灰色的,而一个参数以蓝色示出,并且另一参数以绿色示出。由于此类透析机不提供记录参数的接口,为了自动地记录参数,根据本发明的实施例,参数应当以自动化方式从显示的图像被识别。

图1示出了根据本发明的一个实施例的用于识别一个或多个字符的设备10。该设备10包括调整单元12、转换单元13和字符识别单元14。调整单元12至少包括颜色水平调整单元124。在一个实施例中,如图1中示出的,调整单元12还包括对比度调整单元121、亮度调整单元122和锐化单元123。应当注意,对比度调整单元121、亮度调整单元122和锐化单元123在设备中是可选的。可以预期,调整单元12本身实现其各功能,而不被进一步分成多个单元。

调整单元12可以接收对象的彩色图像。例如,在一个实施例中,调整单元12直接从图像采集单元(诸如相机)接收费森尤斯的4008A透析机的显示的彩色图像,或在另一实施例中,首先从费森尤斯的4008A透析机的显示采集初始彩色图像,调整单元12接收通过处理初始彩色图像而获得的彩色图像,例如,调整单元12接收从初始彩色图像识别的感兴趣区域的彩色图像。将会在下面关于图7-8描述对于透析机的显示的初始彩色图像的预处理。

一旦接收了对象的彩色图像,对比度调整单元121就确定彩色图像的对比度并且根据需要调整彩色图像的对比度。图2示出了根据本发明的一个实施例图示了调整彩色图像的对比度的流程图100。

根据方框101-105,对比度调整单元121扫描并确定彩色图像的对比度,相对于例如阈值或阈值范围评估所确定的对比度,如果所确定的对比度相对于阈值或阈值范围较高,则设置调整值Δ_1,如果所确定的对比度相对于阈值或阈值范围较低,则设置调整值Δ_1’,并且基于调整值调整彩色图像以获得对比度被调整的中间图像。通过调整彩色图像的对比度,可以消除彩色图像的过度曝光和曝光不足。

来自对比度调整单元121的中间图像可以被进一步输入到亮度调整单元122以调整彩色图像的亮度。图3示出了根据本发明的一个实施例图示了调整彩色图像的亮度的流程图200。

根据方框201-205,例如,亮度调整单元122可以确定彩色图像的亮度并相对于例如阈值或阈值范围评估亮度,如果所确定的亮度相对于阈值或阈值范围较高,则设置调整值Δ_2,如果所确定的亮度相对于阈值或阈值范围较低,则设置调整值Δ_2’,并且然后基于调整值调整彩色图像的亮度以获得亮度被调整的第一图像。

通过相对于阈值或阈值范围调整彩色图像的亮度,可以部分地去除彩色图像的背景颜色信息并且改善对字符的识别。一般来说,如果彩色图像的亮度在阈值范围内,则彩色图像的亮度不需要被调整,然而,为了高效地去除背景颜色信息,优选的是仍然调整彩色图像的亮度以使彩色图像更亮一点。在一个实施例中,根据不同的需求调整阈值范围以实现类似的效果也是可能的。

在调整彩色图像的亮度之后,彩色图像被输入到锐化单元123,锐化单元123对第一图像执行图像锐化以去除第一图像中的干扰和噪声信号。锐化单元123可以采用各种锐化方法,作为一个范例,图4示出了根据本发明的一个实施例图示了针对彩色图像执行的反锐化掩膜(USM)锐化的流程图300。在用于去除干扰和噪声信号的实施例中,USM锐化方法是优选的。

根据方框301-304,基于USM锐化方法,锐化单元123可以首先获得彩色图像的像素数据并将高斯模糊应用于该图像,并且然后将USM公式用于经模糊图像以基于输入参数针对彩色图像的每个像素计算新像素值,最后基于新像素值构建新的经锐化图像,其中,可以根据用户输入确定输入参数,并且USM公式是本领域中众所周知的。

在调整彩色图像的对比度和亮度并且锐化该彩色图像之后,可以部分地去除彩色图像的背景颜色信息,并且可以减少噪声。然后来自锐化单元123的经锐化的第一图像可以被输入到颜色水平调整单元124以便进一步处理。

颜色水平调整单元124可以调整彩色图像的颜色水平。图5示出了根据本发明的一个实施例图示了调整彩色图像的颜色水平的流程图400。具体地,根据方框401-405,确定彩色图像的颜色水平,相对于例如预定颜色水平表评估彩色图像的颜色水平,然后如果所确定的颜色水平高于颜色水平表的预定值范围,则设置调整值Δ_3,如果所确定的颜色水平低于颜色水平表的预定值范围,则设置调整值Δ_3’,并且然后基于调整值调整彩色图像的颜色水平以获得经调整图像。

一般来说,通过相对于颜色水平表评估彩色图像的颜色水平并且然后调整彩色图像的颜色水平,彩色图像中对应字符的颜色信息可以被维持或增强,而背景颜色信息可以被去除,由此在后续的光学字符识别程序期间减少由背景颜色信息引入的潜在噪声。

尽管在上面参考图2-5描述了对比度调整单元121、亮度调整单元122、锐化单元123和颜色水平调整单元124,但是在上面提到并在图2-5中示出的处理不是限制性的而是图示性的,也可以预期到用于实现类似效果的其他处理和算法。

此外,尽管在上面鉴于首先调整对比度和亮度、然后锐化并且最后调整颜色水平描述了调整单元12的各项处理,但是也可以预期到以上处理的其他顺序,或上面的一项或多项处理可以被省略和/或组合以满足不同的要求。例如,对比度调整单元121、亮度调整单元122和锐化单元123中的一个或多个可以被省略;或甚至它们全部都可以被省略,在这种情况下,接收的对象的彩色图像被确定为要被颜色水平调整单元124调整的第一图像。

经调整图像可以被输入到转换单元13以被转换成二值图像。由于已经几乎去除了背景颜色信息,因此可以减少噪声和干扰并且可以在二值图像中清楚地识别字符。

在转换之后获得的二值图像被输入到字符识别单元14以在光学字符识别程序中使用。图6示出了图示了基于包括要被识别的字符的二值图像的光学字符识别程序的流程图500。根据如图6中示出的实施例,在方框501处,如果二值图像具有黑色前景和白色背景,它首先被转换为逆二值图像,在一些情况下,该步骤可以被省略;在方框502处,针对每行像素计算二值图像的沿水平方向的投影值总和;在方框503处,将每行像素的投影值总和与水平投影值阈值进行比较,并且然后基于一行像素的投影值总和低于水平投影值阈值的确定结果,将二值图像分成一个或多个行图像,每个行图像包括一行字符;在方框504处,对于每个行图像,执行腐蚀和膨胀算法以使相邻字符作为一个文本单元;在方框505处,针对每列像素计算每个行图像的沿垂直方向的投影值总和;在方框506处,将每列像素的投影值总和与垂直投影值阈值进行比较,并且然后基于一列像素的投影值总和低于垂直投影值阈值的确定结果,将行图像分成每个文本单元;最后在方框507处,每个文本单元中的字符可以通过任何已知的光学字符识别技术来识别。由字符识别单元14执行的以上流程图是图示性的而非限制性的,可以根据要被处理的二值图像和不同需求调整各步骤。

根据以上内容,参考图1,根据本发明的一个实施例描述了用于识别一个或多个字符的设备10。图7示出了根据本发明的另一实施例的用于识别一个或多个字符的设备20。根据该实施例,设备20包括识别单元25、比较单元26、调整单元22、转换单元23和字符识别单元24,其中,调整单元22、转换单元23和字符识别单元24具有与如图1中示出的调整单元12、转换单元13和字符识别单元14类似的功能,设备20与设备10的主要区别涉及识别单元25和比较单元26。在一个范例中,如图7中示出的,识别单元25和比较单元26可以被称为预处理单元21。

根据如图7中示出的实施例,从图像采集单元(未示出)接收的初始彩色图像可以被输入到预处理单元21以获得要在调整单元22中处理的对象的彩色图像。

预处理单元21的识别单元25可以接收初始彩色图像以从该初始彩色图像识别感兴趣区域。对于不提供记录参数的接口的医学设备(诸如透析机),为了以自动化方式识别并记录医学设备的显示器中示出的参数,医师或护理者可以通过图像采集单元(诸如相机)捕获医学设备的显示的图像,所捕获的图像可以是要被处理的初始彩色图像。

有时,所捕获的图像可以包括与医学设备的显示无关的一些信息(例如,站在医学设备的显示器附近的人)或与包括要被识别的字符的感兴趣区域无关的一些信息,通过使用识别单元25,从初始图像识别仅仅感兴趣区域(诸如涉及显示的区域或者包括要被识别的字符的区域),并且因此从所捕获的图像确定对应的图像数据以获得对象的彩色图像,其进而在调整单元22中被调整,可以从初始图像去除其他信息。

图8是图示了根据本发明的一个实施例从初始图像识别感兴趣区域的流程图600。感兴趣区域可以是示出医学设备的显示的区域。根据如图8中示出的实施例,在方框601和602处,首先确定并调整初始彩色图像的尺寸;在方框603处,经调整的初始彩色图像被转换成灰度图像;在方框604-606处,对灰度图像执行膨胀,并且例如利用Canny算法对被膨胀图像检测图像边界以找到具有最大区域的边界;在方框607和608处,计算找出的边界的四个顶点,并且通过基于四个顶点从初始彩色图像确定指示感兴趣区域的图像数据来获得感兴趣区域的彩色图像,感兴趣区域的彩色图像可以被用作要在调整单元22中进一步处理的对象的彩色图像。如图8中示出的处理是图示性的,它们可以被修改,并且可以预期到用于识别感兴趣区域的其他处理。

在一个实施例中,在识别并生成感兴趣区域的彩色图像作为对象的彩色图像之后,彩色图像可以被进一步输入到比较单元26以便进一步处理。比较单元26可以将对象的彩色图像与一个或多个预定模板比较,一个或多个预定模板可以被预先存储并且指示对象的感兴趣图像,其中,如果对象的彩色图像对应一个或多个预定模板,对象的彩色图像在调整单元22中被进一步处理,否则,对象的彩色图像可以被认为是无效的,并且不对它执行过程。这样一来,可以检查要被处理的彩色图像的有效性。

尽管如在图7中示出并在上面解释的,参考识别感兴趣区域(诸如显示区域)的图像数据以获得对象的彩色图像并且然后通过比较彩色图像与预定模板来检查对象的所获得的彩色图像的有效性描述了预处理初始彩色图像,但是应当理解这不是限制性的,(一项或多项)其他处理可以被包括在预处理程序中,例如,图像梯形校正;并且识别单元25和比较单元26的一项或多项处理可以被省略。例如,如果初始彩色图像示出了仅感兴趣区域,识别单元25可以被省略。

在另一实施例中,比较单元26首先接收并比较初始彩色图像与一个或多个预定模板,所述一个或多个预定模板指示示出对象的感兴趣图像,其中,如果初始彩色图像对应一个或多个预定模板,识别单元25从初始彩色图像识别感兴趣区域作为对象以获得要被进一步处理的对象的彩色图像。

尽管图7示出了仅仅用于预处理初始彩色图像的以上处理,但是可以预期,调整单元12中的一项或两项处理可以在预处理单元21中被执行。

根据以上内容,关于不同的实施例、不同的流程图和不同的单元描述了本发明的用于识别一个或多个字符的设备,应当理解,所有流程图都是图示性的,并且根据个体流程图的一项或多项处理可以被删除、修改、组合和/或分开以实现和/或省略其对应的功能。还应当理解,如果必要的话,可以改变过程的顺序。例如,可以首先调整初始彩色图像的对比度,并且然后从经调整的初始彩色图像生成对象的彩色图像以便进一步处理。此外,本发明的设备的个体单元可以被删除、修改、组合和/或分开以实现和/或省略其对应的功能。

图9是根据本发明的一个实施例的用于从初始彩色图像识别一个或多个字符的方法700的流程图。根据该方法700,在701处,接收由例如相机采集的初始彩色图像;在702处,从初始彩色图像识别感兴趣区域作为对象,并且从初始彩色图像确定指示感兴趣区域的图像数据以生成对象的彩色图像,所述感兴趣区域示出要被识别的一个或多个字符。在703处,对象的彩色图像可以被与指示感兴趣图像并且示出对象的一个或多个预定模板比较,如果对象的彩色图像对应一个或多个预定模板,那么在704处,进一步处理对象的彩色图像;否则,处理返回到701以接收新的初始彩色图像。

在704处,基于例如阈值范围确定并调整彩色图像的对比度以获得中间图像;并且然后在705处,基于例如另一阈值范围确定并调整彩色图像的亮度以生成第一图像。在706处,锐化第一图像。在707处,确定并调整彩色图像的颜色水平以生成经调整图像,并且然后在708处,将经调整图像转换成二值图像。基于该二值图像,在709处,可以识别一个或多个字符。

该方法700是图示性的而非限制性的;各个步骤可以被省略、组合和/或修改以省略/修改对应的功能。例如,在一个实施例中,识别感兴趣区域、验证图像、调整图像对比度和亮度、以及锐化图像中的任何一个或多个步骤可以被省略。步骤的顺序也可以被改变。在一个实施例中,首先可以将初始彩色图像与(一个或多个)预定模板比较,在确定初始彩色图像对应于一个模板之后,从初始彩色图像识别感兴趣区域。

在一个实施例中,本发明的设备可以被体现为可以在例如移动电话中运行的应用程序。或者,本发明的设备可以被实现为被配置为执行已经在上面描述的本发明的方法的图像处理器。本发明的设备可以被包括在成像系统中,该成像系统可以进一步包括用于采集初始图像的图像采集单元。

可以预期,本发明的设备的个体单元可以通过软件、硬件或固件中的任一个来实现。此外,机器可读存储介质可以存储用于执行本发明的方法的指令。

请注意,根据本发明的设备和方法不应当被限制为仅上面提到的那样。对本领域技术人员来说将会显而易见的是,所要求保护的本发明的各个方面可以在脱离这些具体细节的其他范例中被实践。

此外,尽管在相互不同的从属权利要求中记载了特定措施,但是这并不表示不能有利地使用这些措施的组合。

应当注意,上述实施例说明而非限制本发明,并且本领域技术人员将能够设计备选的实施例而不脱离随附权利要求书的范围。在权利要求中,在括号中的任何附图标记不得被解释为对权利要求的限制。词语“包括”不排除没有列在权利要求或说明书中的元件或步骤的存在。在元件之前的词语“一”或“一个”不排除多个这样的元件的存在。在列举若干单元的产品权利要求中,可以由同一项软件和/或硬件来实现这些单元中的若干单元。词语第一、第二和第三等的使用不表示任何排序。这些词语被解读为名称。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号