首页> 中国专利> 用于选择并显示分割参数进行光学字符识别的系统与方法

用于选择并显示分割参数进行光学字符识别的系统与方法

摘要

本发明提供了一种用于选择并显示分割参数进行光学字符识别的系统与方法,所述方法可包括接收图像,所述图像具有包括一个或多个字符的字符串。所述方法还可包括接收识别所述一个或多个字符中的每个的字符串。所述方法还可包括自动生成至少一个分割参数。所述方法还可包括利用所述至少一个分割参数对具有字符串的图像进行分割。所述方法还可包括确定所产生的分割是否满足一个或多个标准,并且如果所产生的分割满足所述一个或多个标准,则选择至少一个分割参数。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-05-24

    授权

    授权

  • 2014-06-11

    实质审查的生效 IPC(主分类):G06K9/20 申请日:20131016

    实质审查的生效

  • 2014-05-07

    公开

    公开

说明书

相关申请 

本申请要求于2012年11月21日提交的美国专利申请序号13/684,007以及于2012年10月17日提交的美国专利申请序号13/653,948的优先权,其全部内容结合于此作为参考。 

技术领域

本技术涉及机器视觉系统与方法,更具体地,涉及用于光学字符识别的系统与方法。 

背景技术

OCR技术通常用于很多机器视觉系统中,以便检测与各种制造处理相关的文本。然而,非常难以针对指定的应用程序设置OCR参数,尤其对于新用户而言。例如,在用户围绕OCR字符串选择区域并且分割器未正确地找出字符时,用户在试图手动解决问题时通常遇到困难。与可由系统集成商提前解决的很多应用程序不同,OCR可要求生产车间的技术人员或工程师训练或修改运行时间参数。在引入新部件或使用新印刷或标签时,可发生这种情况。如果默认分割参数起作用,则可相当容易设立现有系统,然而,在这些参数不起作用时,用户面临可能需要调整的一列20-30个参数。这就超过了大部分用户的技能水平。 

发明内容

在一个实现方式中,提供了一种用于选择至少一个分割参数以进行光学字符识别的计算机实现方法。该方法可包括使用一个或多个计算装置接收图像,该图像具有包括一个或多个字符的字符串。该方法还可包括使用所述一个或多个计算装置接收识别所述一个或多个字符中的每个的字符串。该方法还可包括使用所述一个或多个计算装置自动生成至少一个分割 参数。该方法还可包括使用所述一个或多个计算装置利用所述至少一个分割参数对具有字符串的图像进行分割。该方法还可包括使用所述一个或多个计算装置确定所产生的分割是否满足一个或多个标准,并且如果所产生的分割满足所述一个或多个标准,则该方法可包括选择所述至少一个分割参数。该方法还可包括在所述一个或多个计算装置处显示该图像的至少一部分。 

可包括一个或多个以下特征。在一些实施方式中,该方法可包括使用所述一个或多个计算装置显示与该分割相关的用户可选的选项,所述用户可选的选项被配置为允许用户指出正确的分割或错误的分割。该方法还可包括使用所述一个或多个计算装置显示用户可选的选项,所述用户可选的选项被配置为允许用户手动生成经手动产生的分割。该方法还可包括使用所述一个或多个计算装置显示所产生的分割。该方法还可包括使用所述一个或多个计算装置显示所述至少一个分割参数。在一些实施方式中,所述至少一个分割参数可包括一个或多个极性、行细化、角度搜索范围、倾斜搜索范围、标准化模式、笔划宽度、二值化阈值、边界片段、像素数、片段对比度阈值、字符高度、字符宽度、字符间间隔、字符内间隔、与主行相距的片段距离、片段合并模式、最小字符纵横比、字符宽度类型、分析模式、节距度量、节距类型、最小节距、空白插入、空白字符的宽度。该方法还可包括使用所述一个或多个计算装置显示至少一个经训练的图像。 

在另一个实现方式中,提供了一种位于计算机可读储存介质上的计算机程序产品。该计算机程序产品可具有储存在其上的多个指令,在由处理器执行时,这些指令促使该处理器执行操作。操作可包括使用一个或多个计算装置接收图像,该图像具有包括一个或多个字符的字符串。操作还可包括使用所述一个或多个计算装置接收识别所述一个或多个字符中的每个的字符串。操作还可包括使用所述一个或多个计算装置自动生成至少一个分割参数。操作还可包括使用所述一个或多个计算装置利用所述至少一个分割参数对具有字符串的图像进行分割。操作还可包括使用所述一个或多个计算装置确定所产生的分割是否满足一个或多个标准,并且如果所产生的分割满足所述一个或多个标准,则操作可包括选择所述至少一个分割 参数。操作还可包括在所述一个或多个计算装置处显示该图像的至少一部分。 

可包括一个或多个以下特征。在一些实施方式中,操作可包括使用所述一个或多个计算装置显示与该分割相关的用户可选的选项,所述用户可选的选项被配置为允许用户指出正确的分割或错误的分割。操作还可包括使用所述一个或多个计算装置显示用户可选的选项,所述用户可选的选项被配置为允许用户手动生成经手动产生的分割。操作还可包括使用所述一个或多个计算装置显示所产生的分割。操作还可包括使用所述一个或多个计算装置显示所述至少一个分割参数。在一些实施方式中,所述至少一个分割参数可包括一个或多个极性、行细化、角度搜索范围、倾斜搜索范围、标准化模式、笔划宽度、二值化阈值、边界片段、像素数、片段对比度阈值、字符高度、字符宽度、字符间间隔、字符内间隔、与主行相距的片段距离、片段合并模式、最小字符纵横比、字符宽度类型、分析模式、节距度量、节距类型、最小节距、空白插入、空白字符的宽度。操作还可包括使用所述一个或多个计算装置显示至少一个经训练的图像。 

在另一个实现方式中,提供了一种具有一个或多个处理器的计算系统。所述一个或多个处理器可被配置为接收图像,该图像具有包括一个或多个字符的字符串。所述一个或多个处理器可被配置为接收识别所述一个或多个字符中的每个的字符串。所述一个或多个处理器可被配置为自动生成至少一个分割参数。所述一个或多个处理器可被配置为利用所述至少一个分割参数对具有字符串的图像进行分割。所述一个或多个处理器可被配置为确定所产生的分割是否满足一个或多个标准,并且如果所产生的分割满足所述一个或多个标准,则所述一个或多个处理器可被配置为选择至少一个分割参数。所述一个或多个处理器可被配置为在所述一个或多个计算装置处显示所述图像的至少一部分。 

可包括一个或多个以下特征。在一些实施方式中,所述一个或多个处理器可被配置为显示与该分割相关的用户可选的选项,所述用户可选的选项被配置为允许用户指出正确的分割或错误的分割。所述一个或多个处理器可被配置为显示用户可选的选项,所述用户可选的选项被配置为允许用 户手动生成经手动产生的分割。所述一个或多个处理器可被配置为显示所产生的分割。所述一个或多个处理器可被配置为显示所述至少一个分割参数。在一些实施方式中,所述至少一个分割参数可包括一个或多个极性、行细化、角度搜索范围、倾斜搜索范围、标准化模式、笔划宽度、二值化阈值、边界片段、像素数、片段对比度阈值、字符高度、字符宽度、字符间间隔、字符内间隔、与主行相距的片段距离、片段合并模式、最小字符纵横比、字符宽度类型、分析模式、节距度量、节距类型、最小节距、空白插入、空白字符的宽度。所述一个或多个处理器可被配置为显示至少一个经训练的图像。 

下面在附图以及说明书中阐明一个或多个实现方式的细节。通过说明书、示图以及权利要求,其他特征与优点显而易见。 

附图说明

图1为与分布式计算网络耦接的成像过程的图解视图; 

图2为与图1的成像过程的一个实施方式对应的系统示图; 

图3为描述图1的成像过程的一个实施方式的流程图; 

图4为描述图1的成像过程的一个实施方式的流程图; 

图5为与图1的成像过程的一个实施方式相关的图像的图解视图; 

图6为与图1的成像过程的一个实施方式相关的图形用户界面; 

图7为与图1的成像过程的一个实施方式相关的图像的图解视图; 

图8为与图1的成像过程的一个实施方式相关的图像的图解视图; 

图9为与图1的成像过程的一个实施方式相关的图像的图解视图; 

图10为与图1的成像过程的一个实施方式相关的图形用户界面; 

图11为与图1的成像过程的一个实施方式相关的图像的图解视图; 

图12为与图1的成像过程的一个实施方式相关的图形用户界面; 

图13为与图1的成像过程的一个实施方式相关的图形用户界面; 

图14为与图1的成像过程的一个实施方式相关的图形用户界面; 

图15为与图1的成像过程的一个实施方式相关的图形用户界面; 

图16为与图1的成像过程的一个实施方式相关的图形用户界面; 

图17为与图1的成像过程的一个实施方式相关的图形用户界面; 

图18为与图1的成像过程的一个实施方式相关的图像的图解视图; 

图19为与图1的成像过程的一个实施方式相关的图形用户界面; 

图20为与图1的成像过程的一个实施方式相关的图形用户界面; 

图21为与图1的成像过程的一个实施方式相关的图像的图解视图; 

图22为与图1的成像过程的一个实施方式相关的图形用户界面; 

图23为与图1的成像过程的一个实施方式相关的图像的图解视图; 

图24为与图1的成像过程的一个实施方式相关的图像的图解视图; 

图25为与图1的成像过程的一个实施方式相关的图像的图解视图; 

图26为与图1的成像过程的一个实施方式相关的图形用户界面; 

图27为与图1的成像过程的一个实施方式相关的图形用户界面; 

图28为与图1的成像过程的一个实施方式相关的图形用户界面; 

图29为与图1的成像过程的一个实施方式相关的图形用户界面; 

图30为与图1的成像过程的一个实施方式相关的图解视图; 

图31为与图1的成像过程的一个实施方式相关的图解视图; 

图32为与图1的成像过程的一个实施方式相关的图形用户界面; 

图33为与图1的成像过程的一个实施方式相关的图形用户界面; 

图34为与图1的成像过程的一个实施方式相关的图形用户界面; 

图35为与图1的成像过程的一个实施方式相关的图形用户界面; 

图36为与图1的成像过程的一个实施方式相关的图形用户界面; 

图37为与图1的成像过程的一个实施方式相关的图形用户界面; 

图38为与图1的成像过程的一个实施方式相关的图形用户界面; 

图39为与图1的成像过程的一个实施方式相关的图形用户界面; 

图40为与图1的成像过程的一个实施方式相关的图像的图解视图; 

图41为与图1的成像过程的一个实施方式相关的图像的图解视图; 

图42为与图1的成像过程的一个实施方式相关的图形用户界面;以及 

图43为与图1的成像过程的一个实施方式相关的图形用户界面。 

在不同的示图中的相同的参考符号可表示相同的部件。 

具体实施方式

系统概述: 

本公开的实施方式可用于帮助用户设置用于规定的应用程序(例如,机器视觉应用程序)的光学字符识别参数。通常,非常难以为应用程序设置OCR参数,尤其对于新用户而言。例如,在用户围绕OCR字符串绘制区域并且分割处理未正确地找出字符时,用户不能了解要进行的最佳方式。因此,在本文中所公开的实施方式可用于帮助用户尽可能自动地设置OCR参数。在本文中所公开的实施方式包括为OCR选择分割参数的交互式/递增方法。在本文中所公开的实施方式还包括检查分割结果的均匀性的能力,并且如果违反该一致性,则包括自动拒绝特定配置的能力。在本文中所公开的实施方式还允许根据好字符的特定统计性能自动选择分割参数。 

参照图1,示出了可位于计算机12上并且可由计算机执行的成像过程10,该计算机可与网络14(例如,互联网或局域网)连接。计算机12的实例可包括但不限于单个服务器计算机、一系列服务器计算机、单个个人计算机、一系列个人计算机、小型计算机、主机计算机或计算云。计算机12的各种元件可执行一个或多个操作系统,这些操作系统的实例可包括但不限于:例如,Microsoft Windows Server tm;Novell Netwaretm;Redhat Linuxtm、Unix或定制操作系统。 

可储存在耦接至计算机12的存储装置16上的成像过程10的指令集与子程序可由包含在计算机12内的一个或多个处理器(未显示)和一个或多个存储器架构(未显示)执行。存储装置16可包括但不限于:硬盘驱动器;闪盘驱动器、磁带驱动器;光盘驱动器;RAID阵列;随机存取存储器(RAM);以及只读存储器(ROM)。 

网络14可连接至一个或多个二次网络(例如,网络18),该网络的实例可包括但不限于:例如,局域网;广域网;或内联网。 

通过客户端应用程序22、24、26、28可访问成像过程10。客户端应用程序22、24、26、28的实例可包括但不限于标准的网页浏览器、定制的网页浏览器或自定义应用程序。可储存在与客户端电子装置38、40、42、44(分别)耦接的存储装置30、32、34、36(分别)上的客户端应用程序 22、24、26、28的指令集与子程序可由一个或多个处理器(未显示)和包含在客户端电子装置38、40、42、44(分别)内的一个或多个存储器架构(未显示)执行。 

存储装置30、32、34、36可包括但不限于:硬盘驱动器;闪盘驱动器、磁带驱动器;光盘驱动器;RAID阵列;随机存取存储器(RAM);以及只读存储器(ROM)。客户端电子装置38、40、42、44的实例可包括但不限于个人计算机38、膝上型计算机40、智能电话42、笔记型计算机44、服务器(未显示)、启用数据的蜂窝电话(未显示)以及专用网络装置(未显示)。 

客户端应用程序22、24、26、28中的一个或多个可被配置为实现成像过程10的一些或所有功能。因此,成像过程10可为由客户端应用程序22、24、26、28和成像过程10中的一个或多个共同执行的单纯的服务器端应用程序、单纯的客户端应用程序或混合的服务器端/客户端应用程序。 

用户46、48、50、52可通过网络14或者通过二次网络18直接访问计算机12和成像过程10。而且,计算机12可通过二次网络18连接至网络14,如幻象链接线54所示。 

各种客户端电子装置可直接或间接耦接至网络14(网络18)。例如,个人计算机38被显示为通过硬接线网络连接直接耦接至网络14。而且,笔记型计算机44被显示为通过硬接线网络连接直接耦接至网络18。膝上型计算机40被显示为通过在膝上型计算机40和无线接入点(即,WAP)58之间建立的无线通信信道56无线耦接至网络14,该无线通信信道被显示为直接耦接至网络14。WAP58可为例如IEEE802.11a、802.11b、802.11g、Wi-Fi和/或能够在膝上型计算机40和WAP58之间建立无线通信信道56的蓝牙装置。智能电话42被显示为通过在智能电话42和蜂窝网络/网桥62之间建立的无线通信信道60无线耦接至网络14,该无线通信信道被显示为直接耦接至网络14。 

在本技术中,众所周知,所有的IEEE802.11x规格可使用以太网协议以及具避免碰撞的载波感测多重存取(即,CSMA/CA)来进行路径共享。例如,各种IEEE802.11x规格可使用相移键控(即,PSK)调制或互 补码键控(即,CCK)调制。在本技术中,众所周知,蓝牙为电信行业的规格,其允许例如移动电话、计算机以及智能电话使用短距离无线连接来互连。 

客户端电子装置38、40、42、44均可执行操作系统,该操作系统的实例可包括但不限于Apple iOStm、Microsoft Windowstm、Androidtm、Redhat Linuxtm或自定义操作系统。 

现在参照图2,提供了一个示例性实施方式,其描述了被配置为供成像过程10使用的机器视觉系统100。应注意的是,在不背离本公开的范围的情况下,在交替的实施方式中,可使用各种系统实现方式。下面会进一步详细地进行描述,在本文中所描述的成像过程10的实施方式总体上可用于为与指定的字符串相关的一个或多个字符自动调谐分割参数。在检查的过程中,可在任何合适的时间使用在本文中所描述的成像过程。例如,在一些实施方式中,在相对于对象的模式或训练图像对活动或运动时间对象图像进行全球定位/配准之后,并且在检查运行时间对象或功能之前、期间或之后,可产生成像过程的各方面。 

在一些实施方式中,机器视觉系统100可包括成像装置110,该成像装置可为包括板上处理器(onboard processor)(未显示)以及能够运行机器视觉应用程序112的存储器(未显示)的摄像头。合适的接口、警报以及信号可安装在相机成像装置110内和/或连接至该相机成像装置,从而能够对在检查基础对象120期间所检测的感测故障做出响应。在该实施方式中,显示包含多个物体(120)的输送带122。在检查的过程中,这些物体可在成像装置110的预定视场(FOV)内轮流通过。同样,成像装置110可获取每个经观察的物体120的至少一个图像。 

在一些实施方式中,传统的微型计算机130可为任何合适的计算装置,例如,在图1中所示的计算机12。计算机130可包括图形用户界面元件,例如,鼠标132、键盘134以及显示器136。在交替的实施方式中,也可使用其他类型的接口,例如,个人数字助理(PDA)。在一些实施方式中,成像装置110可全天连接至计算机130,尤其在计算机执行图象处理功能的情况下。此外和/或或者,在成像装置内的处理器(例如, 生产线的那些处理器)可允许独立操作与远程计算机自由互连的装置。在该实施方式中,计算机130可连接至成像装置110和/或与该成像装置进行通信,用于对运行时间操作进行设备设置、测试以及分析。 

在一些实施方式中,与模式或训练图像140有关的数据可与计算机130一起储存在磁盘储存器142内,并且可储存在成像装置110的板上存储器内。该数据可包括与成像过程10相关的数据,根据本公开的一个或多个实施方式,可使用该数据。 

而且,参照图3,并且下面会更详细地进行讨论,成像过程10可包括接收(302)图像,该图像具有包括一个或多个字符的字符串。成像过程10还可包括接收(304)识别所述一个或多个字符中的每个的字符串。成像过程10还可包括自动生成(306)至少一个分割参数。成像过程10可包括使用所述至少一个分割参数对具有字符串的图像进行分割(308)。成像过程10还可包括确定(310)所产生的分割是否满足一个或多个标准,并且如果所产生的分割满足所述一个或多个标准,则选择(312)所述至少一个分割参数。成像过程10还可包括在所述一个或多个计算装置处显示(314)该图像的至少一部分。 

在本文中所公开的实施方式致力于进行与机器视觉检查相关的光学字符识别的计算机实现方法。在一些实施方式中,成像过程10可被配置为解决现有方法的很多限制。例如,一些现有方法通过预先训练多个字体并且使OCR工具检验多个字体,以确定哪个字体正确,从而解决设置问题。然后,可估计其他参数,例如,用于分割参数的值。由于所选择的字体不能完美地匹配,这可产生次佳的参数选择,所以限制该方法。 

现在参照图4,提供了描述成像过程10的一个实施方式的流程图400。如图4中所示,成像过程10可利用具有自动分割以及自动调谐功能的递增过程。在一些实施方式中,成像过程10可允许用户使用用户的最少信息反复地设置OCR工具。最终结果是完全配置并训练的OCR工具。因此,并且如图4中所示,成像过程10可接收图像402,该图像具有包括一个或多个字符的字符串。成像过程10可通过Run OCR Max选项404为用户提供继续成像过程10的选项。成像过程10也可提供与分割相关的用户可选 的选项406。在一些实施方式中,用户可选的选项可被配置为允许用户指出正确的分割或错误的分割。如果该分割正确,则用户可具有指示正确的分类或错误的分类的选项408。如果分类正确,则成像过程10可进入自动调谐414,下面会进一步详细地进行讨论。如果分类错误,则用户可具有指定字符串的选项420。 

在一些实施方式中,如果分割错误,则成像过程10可提供自动分割功能410,下面会进一步详细地进行讨论。在自动分割之后,用户可具有通过选项412指出分割结果是否正确的选项。如果发现正确的分割,则成像过程10可进入自动调谐414。如果未发现正确的分割,则用户可具有确定图像是否差的选项。如果这样的话,成像过程10可接收一个或多个额外的图像,每个图像具有一个额外的字符串。如果不是的话,成像过程10可为用户提供用户可选的选项424,该选项被配置为允许用户手动生成分割。 

在一些实施方式中,成像过程10可用于生成至少部分使用第一字符串和额外的字符串中的一个或多个的字符数据库。一旦成像过程10已经接收用于字符串的正确分割的指示,就可储存这组相关的正确分割参数,以供将来使用。因此,成像过程10可将这组正确的分割参数应用于未来的字符串中。然后,可调谐这组正确的分割参数,并且可发现使用一个最佳分割参数值。然后,可提取新字体字符,并且训练和使用分类器。通过这种方式,成像过程10可继续,直到用户确信完全训练该字符并且当前的分割参数恰当地运行。可复制字体和分割参数,并且可继续进行自动调谐处理。 

在一些实施方式中,成像过程10可解决用户在设置OCR工具时可面临的很多问题。在操作期间,在用户在图像内的字符串周围绘制区域并且默认分割参数未正确地运行时,一般用户难以断定改变哪个参数以进行正确分割。例如,在现有系统中,分割工具可包括各种分割参数,每个参数可需要手动变更。在图5中所示的成像过程10示出了默认参数未正确分割字符的情况的实例。 

现在参照图6,提供根据成像过程10可使用的图形用户界面600的一个实施方式。在操作期间,用户可规定使用文本字段602的字符串。通过选择自动分割功能604,GUI600可允许用户调用自动分割算法。GUI600也可允许用户通过手动分割功能606执行手动分割。 

在一些实施方式中,通过各种分割参数组合,与成像过程10相关的自动分割算法可继续进行,并且可探索多个分割参数以及发现与字符串长度相同的区段数的参数组合。下面进一步详细讨论分割参数。如在本文中所讨论的,将至少一个分割参数应用于字符串的短语可表示使用至少一个分割参数在字符串的图像上执行分割。 

在一些实施方式中,除了确定正确数量的区段,成像过程10还可被配置为根据字符的不均匀性拒绝某些结果。例如,考虑到字符的ASCII表示,可确定字符串是否包含一个特别的字符,例如,窄、短或宽字符。在一些实施方式中,如果字符串不包含任何特别的字符,则所有区域宽度和高度需要具有相同的尺寸(或在预定的公差内),或者可拒绝该结果。如果字符串包含一个特别的字符,则可检查单独字符尺寸的均匀性。在图7-9中示出了不均匀的并且遭拒绝的结果的几个实例。 

现在参照图10,提供了描述图形用户界面1000与相关图像的一个实施方式。因此,与成像过程10相关的自动分割算法可执行并生成一个或多个可能正确的结果,用于显示给用户,如图10中所示。在操作期间,用户可选择看似正确的一个结果,并且选择与GUI1000相关的OK图标。现在,该算法的第二部分继续进行。通过这种方式,自动调谐算法可为这个特定的图像确定要运行的最佳和/或最优的分割参数。可将正确的记录加入该模式中,可提取每个独特的字符,并且可训练字体,用于进行分类。在图11中所描述的图像显示了通过正确分割并分类的字符在该操作之后运行成像过程10的结果。 

现在参照图12至图14,提供了描述图形用户界面1200-1400的实施方式。GUI1200显示了在成像过程10中已经为这个特定的字体提取的字符。如果在下一个图像上分割失败,则用户可重复在上面确定的一个或多个操作,如图13至图14中所示。 

现在参照图15至图16,提供了描述图形用户界面1500的一个实施方式。如图15中所示,一旦将新记录加入该模式中,除了新的记录以外,所提取的最佳分割参数还可在先前的记录上进行操作。如在该实例中所述,现在,字符包括如图16中所示的字符“-”。 

在一些实施方式中,成像过程10可允许用户手动编辑一个特定的字符串。在该特定的实例中,在编辑并且手动校正区域时,自动分割算法可根据所建立的正确字符区域进行操作。图17显示了所建立的分割参数未正确地分割字符‘8’的一个实例。因此,用户可选择手动分割功能1706并调整在字符‘8’周围的区域,以封闭整个字符,如图18中所示。在选择OK之后,考虑到每个区段的正确位置和尺寸,可运行自动分割算法。因此,与成像过程10相关的自动分割算法可探索分割参数的不同组合,并且在当前记录上应用该组合,如图19至图20中所示。对于所计算(正确地或错误地)的每个结果,可比较结果区域与所建立的正确区域。 

一些可能的情况可包括但不限于确定在所建立的正确区域与结果区域之间的良好匹配在公差内(例如,默认80%的区域重叠)。在该特定的实例中,可为良好的部件提取各种不同类型的信息,例如,最小-最大、像素数、宽度、高度等。在某些情况下,在不存在于所建立的正确区域内的结果中,可具有一个区域。在该特定的实例中,可为额外的部件提取各种数据。此外和/或或者,在不存在于结果内的所建立的正确区域中,可具有一个区域。在该特定的实例中,可使用黄金区域为缺失的部件提取各种数据,并且可将各种数据加入良好的部件中。此外和/或或者,在这两者之间可具有较差的匹配(例如,区域重叠可小于公差)。在该特定的实例中,可为良好的部件使用所建立的正确区域来提取各种数据。如果有的话,该统计数据可与在模式中的记录的所有统计数据相结合。在一些实施方式中,可修改分割参数,以排除额外的部件并且包括良好的部件。对于某些分割参数组合,这可产生所有区域与所建立的正确区域匹配的结果。可选择这个最佳匹配的结果,并且将该结果加入模式中。然后,除了字体字符,还可提前最正确的分割参数。 

在一些实施方式中,随着在该模式中的记录数量的增加,可提取最佳数量的字体字符,以将在该模式中的记录的所有字符成功地分类。如果由于字符的第二实例与经训练的字符相差太大,从而未正确地将字符的第二实例分类,则可将该实例加入字体中。通过这种方式,用户可确认他/她的字体在所有记录上起作用。 

如在本文中所讨论的,成像过程10可包括一个或多个分割参数。一些分割参数可包括但不限于下面所讨论的那些参数,仅仅通过实例提供这些参数,并且这些参数并非旨在作为详细清单。 

在一些实施方式中,分割参数可包括极性。例如,所有字符的极性在输入图像中。 

在一些实施方式中,分割参数可包括例如行细化模式,该模式可规定要使用的行细化技术。行细化模式可为经典模式或标准。 

在一些实施方式中,分割参数可包括例如角度搜索范围,该范围在程度上可与角度搜索范围的一半对应。其为相对于搜索区域的角度在范围上搜索的用于行的角度。 

在一些实施方式中,分割参数可包括例如倾斜范围,该范围在程度上可与倾斜搜索范围的一半对应。其为相对于搜索区域的倾斜在范围上可搜索的用于行的倾斜。 

在一些实施方式中,分割参数可包括例如标准化模式,该模式可规定用于使输入图像标准化的方法。可将其设置为全局阈值、局部阈值或局部先进。 

在一些实施方式中,分割参数可包括例如笔划宽度,该笔画宽度可规定是否从标准化的图像中去除看起来没有与该图像的剩余部分相同的笔划宽度的一切物体。如果例如字符看起来通过细小的噪声条纹彼此连接,则这可较为有用。 

在一些实施方式中,分割参数可包括例如二值化阈值,该二值化阈值可在标准化的图像中规定用于计算二值化阈值的修改器,该二值化阈值在前台与后台之间进行二值化。 

在一些实施方式中,分割参数可包括例如边界片段,该边界片段可规定是否完全忽略触及搜索区域的任何边界的任何片段。 

在一些实施方式中,分割参数可包括例如片段像素数,例如,字符片段可具有以便考虑可能包含在字符内的最小数量的前台(例如,文本)像素。字符片段可为在二值化图像中的二进制大对象。 

在一些实施方式中,分割参数可包括例如字符必须具有以便记录的最小数量的前台(例如,文本)像素。 

在一些实施方式中,分割参数可包括片段对比度阈值,例如,片段相对于二值化阈值必须具有以便考虑可能包含在字符内的最小程度的对比度(例如,具有标准化图像的灰度等级)。 

在一些实施方式中,分割参数可包括像素的字符高度,例如,字符必须具有以便记录的字符的标记矩形的最小高度。分割参数也可包括是否将最小字符高度功能用于限制字符的最大高度和/或字符行。分割参数也可包括字符的标记矩形的像素的最大允许高度。 

在一些实施方式中,分割参数可包括像素的字符宽度,例如,字符必须具有以便记录的字符的标记矩形的最小宽度。分割参数也可包括字符的标记矩形的像素的最大允许宽度。可将比该值更宽的字符分成不太宽的几块。分割参数还可包括是否将最大字符宽度功能用于限制字符的最大宽度。 

在一些实施方式中,分割参数可包括像素的字符间间隔,例如,可在两个字符之间发生的最小间隔尺寸。如果在两个片段之间的间隔小于该字符间间隔,则必须将其视为相同字符的一部分。 

在一些实施方式中,分割参数可包括像素的字符内间隔,例如,可在单个字符内发生的最小间隔尺寸,甚至用于损坏的字符。例如,在点阵印记内的连续点列之间,或者在由划痕损坏的两块连写字符之间,可具有字符内间隔。可将大于该值的任何间隔解释为在两个单独字符之间的中断,然而,可将小于或等于该值的间隔解释为在单独字符之间的中断或者在单个字符内的间隔。 

在一些实施方式中,分割参数可包括与主要行相距的片段距离,例如,片段作为所估计的行高的百分比在字符的主要行外面可具有的最大距离。 

在一些实施方式中,分割参数可包括字符片段合并模式,该模式可规定例如用于确定在组阶段中是否将两个片段合并到一个字符中的模式。该模式可被设为requireOverlap(例如,字符片段必须水平重叠至少一个像素,以合并)。还可将该模式规定为specifyMinIntercharacterGap(例如,其间具有水平间距的字符片段可合并,以形成字符,其中,可合并间距小于minIntercharacterGap的任何两个片段)。还可将该模式规定为specifyGaps(例如,其间具有水平间距的字符片段可合并,以形成字符,决定根据minIntercharacterGap与maxIntracharacterGap合并两个片段)。 

在一些实施方式中,分割参数可包括最小字符纵横比,该最小字符纵横比例如可规定是否分割宽字符。 

在一些实施方式中,分割参数可包括字符宽度类型,该字符宽度类型例如可规定在字体中的字符宽度预期变化的方式。要注意的是,字符宽度为标记矩形(例如,油墨边界框)而非单元矩形(其通常可包括在标记矩形周围的衬垫)的宽度。可将宽度类型设为“未知”、“固定”或“可变”。 

在一些实施方式中,分割参数可包括分析模式,该分析模式可规定例如是否进行“最小分析”或“标准分析”。最小分析可根据上述参数进行直接分割。标准分析可总体上对行(包括例如字符间距)进行分析,以确定最佳分割。 

在一些实施方式中,分割参数可包括节距度量,该节距度量可用于例如规定字符间距。要注意的是,节距为在相邻的字符上的(大致)相应点之间的距离,而非从一个字符的结尾到下一个字符的开头的距离(称为“字符间间隔”)。可将该节距设为“未知”、“leftToLeft”“centerToCenter”、“rightToRight”等。 

在一些实施方式中,分割参数可包括节距类型,该节距类型可规定例如单独的节距值预期变化的方式;如节距度量所规定的,测量该节距值。可将该节距类型设为“未知”、“固定”、“成比例”或“可变”。 

在一些实施方式中,分割参数可包括像素的最小节距,该最小节距可规定例如在两个字符之间可发生的最小节距,其中,如节距度量所规定的,计算该节距。 

在一些实施方式中,分割参数可包括空白插入,该空白插入可规定例如处理空白字符插入在其他字符之间的间隔内的方式。可将该空白插入设置为“无空间”、“单个空间”、或“多个空间”。 

在一些实施方式中,分割参数可包括像素的空白字符的宽度,该空白字符的宽度可规定例如空白字符的最小宽度。此外和/或或者,分割参数可包括空白字符的最大宽度,其规定例如像素的空白字符的最大宽度。 

在一些实施方式中,分割参数可包括最小部分,两个字符片段在x方向必须彼此重叠最小部分,以便将这两个片段视为相同字符的一部分。 

在一些实施方式中,分割参数可包括字符的最小允许纵横比,其中,将该纵横比定义为将整行字符的高度除以字符的标记矩形的宽度。将其纵横比小于该值(例如,其宽度过大)的字符分成不太宽的块体。 

在一些实施方式中,成像过程10可包括仅仅自动分割规定的正确字符串并且拒绝不均匀的结果。成像过程10也可自动分割规定的字符串以及所建立的字符的正确区域。如在本文中所讨论的,成像过程10可被配置为训练模式记录的规定的字体。 

在一些实施方式中,成像过程10可包括接收包含一个实例字符串的一个新图像,并且接收在该字符串中识别正确字符的字符串,而非字符串的正确分割区域。成像过程10可被配置为通过不同的分割参数组自动生成字符串的图像的可能分割。成像过程10可在字符串的可能正确的分割之间进行选择,每个分割具有与其相关的候选分割参数并且可使用字符串的所选择的正确分割的分割参数来进行光学字符识别。 

在一些实施方式中,成像过程10可包括接收包含一个实例字符串的一个新图像,并且在该字符串中识别正确字符,而非字符串的正确分割。成像过程10可自动生成字符串的图像的分割参数和分割结果的候选组。成像过程10可在字符串的可能正确的分割之间进行选择,每个分割具有与其相关的候选分割参数,可搜索所有候选结果,比较这些分割区域与由 用户选择的那个分割区域,并且识别在某个百分比内产生相似区域的分割参数。除了所发现的所有分割参数以外,成像过程10还可通过在模式内正确地分割字符串来储存所选择的图像。成像过程10可重复进行在上面确定的操作,直到独特地选择或最佳地发现分割参数。 

在一些实施方式中,成像过程10可包括接收包含一个实例字符串的一个新图像,并且在该字符串中识别正确字符,而非字符串的正确分割。成像过程10可被配置为自动生成字符串的图像的分割参数和分割结果的候选组。成像过程10可在字符串的可能正确的分割之间进行选择,每个分割具有与其相关的候选分割参数。如果上述选择都不正确,则成像过程10可提供字符串的正确分割并且根据字符串的正确分割自动确定分割参数。除了所发现的所有分割参数以外,成像过程10还可通过在模式内正确地分割字符串来储存所选择的图像。成像过程10可重复进行以上操作,直到唯一地选择或最佳地发现分割参数。 

在一些实施方式中,成像过程10可包括尝试不同的分割参数并且生成具有与字符串的长度相同的区段数的结果。考虑到字符在字符串中的ASCII表示,成像过程10可拒绝不满足均匀性标准的可能结果。成像过程10可生成字符串的图像的可能分割的向量以及相关的候选分割参数。 

在一些实施方式中,除了先前发现的所有分割参数,成像过程10还可通过正确地分割字符串来接收图像的向量。成像过程10可尝试所有先前发现的分割参数,并且生成具有与字符串的长度相同的区段数的结果。考虑到字符在字符串中的ASCII表示,成像过程10可拒绝不满足均匀性标准的可能结果。成像过程10可生成字符串的图像的可能分割的向量以及相关的候选分割参数。 

在一些实施方式中,除了先前发现的所有分割参数,成像过程10还可通过正确地分割字符串来接收图像的向量。成像过程10可尝试所有先前发现的分割参数,并且生成具有与字符串的长度相同的区段数的结果。如果任何分割参数未成功,则成像过程10可使用先前运行和重试的统计数据来通过反复的方式调整参数。考虑到字符在字符串中的ASCII表示,成像过程10可拒绝不满足均匀性标准的可能结果。成像过程10可通过正 确的分割在图像的向量上应用所储存的分割参数,并且拒绝失败的分割参数。成像过程可生成字符串的图像的可能分割的向量以及相关的候选分割参数。 

在一些实施方式中,成像过程10可通过正确分割字符串来接收图像的向量。成像过程10可通过正确分割字符串来从图像的向量中提取分割参数的范围。一些实例可包括但不限于字符宽度、高度、片段与字符的像素数量、字符间与字符内间隔等的范围。成像过程10可尝试在所提取的范围内的不同分割参数,并且生成具有与字符串的长度相同的区段数的结果。考虑到字符在字符串中的ASCII表示,成像过程10可拒绝不满足均匀性标准的可能结果。成像过程10可通过正确的分割在图像的向量上应用所储存的分割参数,并且拒绝失败的分割参数。成像过程10可生成字符串的图像的可能分割的向量以及相关的候选分割参数。 

在一些实施方式中,考虑到包含一个实例字符串的图像、在该字符串中的正确字符以及字符串的正确分割,成像过程10可被配置为自动生成可能的分割参数。通过这种方式,成像过程10可通过正确分割字符串来提取分割参数的范围。一些实例可包括但不限于字符宽度、高度、像素数量、节距以及字符间间隔的范围。成像过程10可尝试在所提取的范围内的不同分割参数,并且仅仅保持具有与字符串的正确分割的区域几乎(例如,在某个百分比内)匹配的区域的结果。成像过程10可生成字符串的图像的正确分割的向量以及相关的正确分割参数。 

在一些实施方式中,除了先前发现的所有分割参数,成像过程10还可被配置为通过正确地分割字符串来接收图像的向量。成像过程10可尝试所有先前发现的分割参数,并且仅仅保持具有与字符串的正确分割的区域几乎(例如,在某个百分比内)匹配的区域的结果。成像过程10可生成字符串的图像的可能分割的向量以及相关的候选分割参数。 

在一些实施方式中,除了先前发现的所有分割参数,成像过程10还可被配置为通过正确地分割字符串来接收图像的向量。成像过程10可被配置为通过正确分割字符串来提取分割参数的范围。一些实例可包括但不限于字符宽度、高度、像素数量、节距以及字符间间隔的范围。通过添加 不同的分析与标准化模式、前台阈值、宽度类型等,成像过程10可扩大所有先前发现的分割参数。成像过程10可扩大分割参数,并且仅仅保持具有与字符串的正确分割的区域几乎(例如,在某个百分比内)匹配的区域的结果。成像过程10可生成字符串的图像的可能分割的向量以及相关的候选分割参数。 

在一些实施方式中,除了先前发现的所有分割参数,成像过程10还可通过正确地分割字符串来接收图像的向量。成像过程10可被配置为通过正确分割字符串来提取分割参数的范围。一些实例可包括但不限于字符宽度、高度、像素数量、节距以及字符间间隔的范围。成像过程10可尝试所有先前发现并扩大的分割参数,并且仅仅保持具有与字符串的正确分割的区域几乎(例如,在某个百分比内)匹配的区域的结果。如果任何分割参数未成功,则成像过程10可使用先前运行和重试的统计数据来通过反复的方式调整参数。成像过程10可通过正确的分割在图像的向量上应用所储存的分割参数,并且拒绝失败的分割参数。成像过程10可生成字符串的图像的可能分割的向量以及相关的候选分割参数。 

在一些实施方式中,成像过程10可通过正确分割字符串来接收图像的向量。成像过程10可被配置为通过正确分割字符串来提取分割参数的范围。一些实例可包括但不限于字符宽度、高度、像素数量、节距以及字符间间隔的范围。成像过程10可被配置为通过正确分割字符串来从图像的向量中提取分割参数的范围。一些实例可包括但不限于字符宽度、高度、片段与字符的像素数量、字符间与字符内间隔等的范围。成像过程10可在所提取的范围内应用不同的分割参数,并且仅仅保持具有与字符串的正确分割的区域几乎(例如,在某个百分比内)匹配的区域的结果。成像过程10可通过正确的分割在图像的向量上应用所储存的分割参数,并且拒绝失败的分割参数。成像过程10可生成字符串的图像的可能分割的向量以及相关的候选分割参数。 

在一些实施方式中,成像过程10可包括从分割算法之前的运行中使用统计数据来自动调整分割参数。成像过程10可包括接收包含一个实例字符串的一个新图像,并且在该字符串中识别正确字符,而非字符串的正 确分割。成像过程10可提供分割参数组,应用分割算法并且比较经分割的区域数量与字符串长度。如果经分割的区域数量少于字符串长度,则成像过程10可调整分割参数,以包括更多拒绝的部件。如果经分割的区域数量多于字符串长度,则可调整分割参数,以排除更多的经保持的部件。成像过程10可重复进行一些或所有上述操作,持续最大迭代次数,或者直到发现相同的数量的区段。 

在一些实施方式中,成像过程10可包括接收包含一个实例字符串的一个新图像,并且在该字符串中识别正确字符以及字符串的正确分割。成像过程10可提供分割参数组,应用分割算法并且比较经分割的区域与正确分割的区域。可为每个区段提取统计数据,包括宽度、高度、像素数、片段像素数、对比度等。用于缺失的区段(例如,在特定的位置中,在结果中不存在的区段)的统计数据可收集在一个组内。用于正确的区段(例如,重叠很好的区段)的统计数据可加入该组中。可通过正确分割字符串,提取用于错误结果(例如,重叠不太好的结果)的统计数据,并且将该统计数据添加到该组中。可单独地收集用于额外区段(例如,在特定的位置中,在正确分割字符串时不存在的区段)的统计数据。可调节分割参数,以排除额外的区段,但是包括所有其他的区段。成像过程10可反复地重复进行一个或多个上述操作,持续最大迭代次数,或者直到发现正确的分割。 

现在参照图21至图43,提供了描述与成像过程10相关的各种图形用户界面的实施方式。应注意的是,在本文中所描述的各种实施方式旨在对成像过程10提供一般概述,仅仅通过实例提供特定的图形用户界面,并且这些图形用户界面在任何情况下都并非旨在限制本公开的范围。 

在一些实施方式中,通过加载当前的图像,成像过程10可正常地运行,显示分割以及分类结果。如果分割区域看起来不正确,则用户可输入字符串并且做出选择,以固定分割,从而将结果返回给用户。用户选择正确的结果并且可选择将当前的记录加入自动调谐模式中的按钮。用户可加载另一个图像。如果经分割的区域正确,并且将字符正确地分类,则用户可具有接受变化的选项(分割参数或分割参数与字体)。 

在一些实施方式中,通过加载当前的图像,成像过程10可正常地运行,显示分割以及分类结果。如果分割区域看起来不正确,则用户可输入字符串并且做出选择,以固定分割,从而将结果返回给用户。用户选择正确的结果并且可选择将当前的记录加入自动调谐模式中的按钮。用户可加载另一个图像。如果经分割的区域正确,但是未将字符正确地分类,则用户可规定字符串并且做出选择,以固定分类,并且将结果加入自动调谐模式中。用户可加载另一个图像。如果经分割的区域正确,并且将字符正确地分类,则用户可具有接受变化的选项(分割参数或分割参数与字体)。 

在一些实施方式中,通过加载当前的图像,成像过程10可正常地运行,显示分割以及分类结果。如果分割区域看起来不正确,则用户可输入字符串并且做出选择,以固定分割,从而将结果返回给用户。用户选择正确的结果并且可选择将当前的记录加入自动调谐模式中的按钮。用户可加载另一个图像。如果经分割的区域不正确,则用户可重复一些或所有以上步骤,无需规定新区域。然后,用户可加载另一个图像。如果区域正确,并且将字符正确地分类,则用户可进行选择,接受变化(分割参数或分割参数与字体)。 

在一些实施方式中,通过加载当前的图像,成像过程10可正常地运行,显示分割以及分类结果。如果分割区域看起来不正确,则用户可输入字符串并且做出选择,以固定分割,从而将结果返回给用户。如果结果不正确并且需要调整分割区域,则用户可调整分割区域并且做出选择,以便将记录加入自动调谐模式中。用户可加载另一个图像,如果区域正确,并且将字符正确地分类,则用户可决定接受变化(分割参数或分割参数与字体)。 

在一些实施方式中,通过加载当前的图像,成像过程10可正常地运行,显示分割以及分类结果。如果分割区域看起来不正确,则用户可输不正确并且做出选择,以固定分割,从而将结果返回给用户。用户可选择正确的结果并且决定将记录加入自动调谐模式中。然后,用户可加载另一个图像,如果经分割的区域正确,并且将字符正确地分类,则用户可选择“拒绝”按钮,以拒绝自动调谐参数。 

在一些实施方式中,通过加载当前的图像,成像过程10可正常地运行,显示分割以及分类结果。如果分割区域看起来不正确,则用户可输不正确并且做出选择,以固定分割,从而将结果返回给用户。用户可选择正确的结果并且做出选择,以将记录加入自动调谐模式中。用户可加载另一个图像。如果经分割的区域正确,并且将字符正确地分类,则用户可决定没有时间完成自动调谐数据,从而可提供“保存”按钮,以保存自动调谐数据。 

在一些实施方式中,通过加载当前的图像,成像过程10可正常地运行,显示分割以及分类结果。如果分割区域看起来不正确,则用户可输入字符串并且做出选择,以固定分割,从而将结果返回给用户。用户可选择正确的结果并且点击将记录加入自动调谐模式中的按钮。用户可加载另一个图像,如果经分割的区域看起来不正确,则用户可输入字符串并且做出选择,以固定分割。可将结果返回给用户。用户可选择正确的结果并且做出选择,以将记录加入自动调谐模式中。如果现在在自动调谐模式中的第一记录失败,具有新分割参数,则用户可选择在自动调谐模式中的最后的自动调谐记录并选择“删除”按钮。可自动重新调谐自动调谐模式,并计算新分割参数。用户可加载另一个图像。如果经分割的区域正确,并且将字符正确地分类,则用户可做出选择,以接受变化(分割参数或分割参数与字体)。 

现在参照图21,在用户处于“重新调谐”模式中时,成像过程10的实施方式可正常地运行,进行分割和分离。因此,成像过程10显示分割与分类图形,如图21中所示。如果分割区域或分类不正确,则在用户处于“重新调谐”模式中时,该行为改变。如图22中所示,通过按钮或其他合适的选项,可启动自动调谐。如图23中所示,在用户希望看到诊断图形时,根据正在显示的信息,会看到装有不同的有色矩形的图像。例如,并且如图23中所示,在拒绝的片段周围的区域可显示为黄色,并且字符的主行可显示为蓝色(未显示)。图24描述了拒绝的字符。此外和/或或者,并且如图25中所示,在保持的片段周围的区域可显示为蓝绿色,并且字 符的主行可显示为蓝色。在不背离本公开的范围的情况下,可使用大量其他设置与方法。 

在一些实施方式中,在位于新的诊断选项卡中时,成像过程可向用户显示与行数据、保持的片段、拒绝的片段、保持的字符以及拒绝的字符有关的信息。例如,行数据可包括但不限于角度、倾斜、最小/最大字符间间隔(像素)、最小/最大字符内间隔(像素)、最小/最大节距。保持的片段可包括但不限于最小/最大尺寸(像素)、最小/最大对比度(%)以及MaxDistanceToMainLine(%)。拒绝的片段可包括但不限于最小/最大尺寸(像素)、最小/最大对比度(%)以及MaxDistanceToMainLine(%)。保持的字符可包括但不限于最小/最大字符宽度(像素)、最小/最大字符高度(像素)以及最小/最大字符尺寸(像素)。拒绝的字符可包括但不限于最小/最大字符宽度(像素)、最小/最大字符高度(像素)以及最小/最大字符尺寸(像素)。 

现在参照图26,显示了描述图形用户界面2600的一个实施方式。界面2600可包括显示诊断文本数据的选项卡。在一些实施方式中,可添加下拉式菜单,以规定显示哪个诊断图形。在一些实施方式中,“显示诊断”下拉式菜单可与“显示”下拉式菜单一起起作用。在位于属性表内时,如果将“显示诊断”设为非“全部隐藏”,则就仅仅可显示诊断图形。在位于属性表内部时,如果将“显示诊断”设为“全部隐藏”,则显示正常的图形。在位于属性表外部时,如果将“显示”下拉式属性设为“全部显示”或“仅仅显示结果图形”,则显示正常的图形以及“显示诊断”所设定的任何物体。在位于属性表外部时,如果将“显示”下拉设为“全部隐藏”,则图形为在用户打开属性表时图形的样子。 

在本文中所描述的成像过程的实施方式可使用各种分类算法。这些分类算法中的一些算法可包括但不限于用于将字符分类的基本分类算法、用于将字符分类的位于基本的验证程序之前的基本分类算法以及具有积极性流线型算法的用于将字符分类的基本分类算法。在一些实施方式中,可使用各种默认分类算法。例如,通过在图27中所示的“跳过额外字符验证”复选框可选择一种特定的模式。在一些实施方式中,如果作业文件为 比固件更旧的版本,则固件可根据一个特定的参数自动设置分类。此外和/或或者,如果作业文件为比固件更新的版本,则固件可根据一个合适的参数自动设置分类。 

在一些实施方式中,在处于自动调谐模式中时,在操作期间可进行分割和分类。随后,用户可希望添加选项,以便每当加载图像并且执行处理时不进行分类。在完成自动调谐并且用户认为分割参数或分割参数与训练良好时,可提交这些更改。 

本公开的实施方式可利用各种文库以及与那些文库连通的相关固件。在本文中所描述的成像过程可被配置为将各种信息显示给一个或多个图形用户界面。因此,可具有将信息从文库中一直记录到特定的用户界面中的几条消息。例如,该消息在自动调谐模式中将有关每个记录的记录信息一直发送给一个特定的用户界面,该用户界面可被配置为显示该信息。此外和/或或者,一些消息可被配置为将自动调谐图形与图像发送给一个特定的用户界面,用于进行显示。一些消息可被配置为促使自动调谐会话结束,并且可更新分割参数,文库计算这些分割参数,用于随后向用户显示。 

在一些实施方式中,用户可启动自动调谐功能,并且可使用一个或多个图像进行训练。对于每个图像,用户可决定是否正确地将字符分割与分类。如果不是的话,训练失败的图像,并且该算法会找出正确地分割该图像以及先前训练的图像的分割设置。由于训练更多的图像,所以自动调谐算法可变得更可靠更精确。在满足用户时,可应用新分割设置,并且可通过最近训练的字符更新字体。在自动调谐的过程中训练的字符具有多个优点,其中的一些优点可包括但不限于用户不需要通过一组图像循环两次(一次用于进行分割,一次用于训练字符),而且由于可使用从调谐处理中获得的分割参数,自动训练字符,所以提高了阅读的精确性。 

在本文中所使用的短语“字符分割”可表示在检查区域内发现每个字符的界限(顶部、左边、底部、右边边缘)的处理或行为。可使用在本文中所描述的一个或多个算法进行字符分割。短语“自动调谐记录”可由图像、训练字符串以及字符在图像内的用户验证位置构成。短语“自动调谐 模式”可表示总共零个或多个自动调谐记录,外加最佳地正确分割所有记录的配置设置。 

在本文中所讨论的自动调谐的概念可表示用于识别最佳分割参数的引导过程。在该过程完成之后,可更新分割参数。在一些实施方式中,自动调谐处理要求多个图像成功。用户界面可被配置为通过获取图像以及评估结果的处理引导用户。因此,用户不应面对压倒性数量的要选择的结果。这些结果应不同并且在数量上进行限制。应提示用户将自动调谐会话保存到磁盘中,以便防止浪费精力。可由用户界面自动恢复最后保存的会话。 

在一些实施方式中,自动调谐处理可需要大量CPU与存储器资源。一旦该处理完成并且更新设置和字体,就不再需要这些资源,并且可释放这些资源。在一些实施方式中,关键是尽快释放资源。一旦自动调谐处理完成(即,用户接受设置或取消),就可释放所有自动调谐资源。跨过会话,未在资源之间(例如,训练的图像等)保持信息。如果期望操作进行两秒钟,则可显示进度条。不可使用进度反馈(完成47%),因此,进度条仅仅表示操作依然积极。没有取消操作的机构。 

在一些实施方式中,在训练期间,用户按压属性表或设置面板的自动调谐。用户面对自动调谐对话框,并且可获得一个新图像。然后,用户可训练该新图像,进入另一个步骤或者选择OK以退出。更新新的分割参数,并且更新字体。 

在一些实施方式中,在通过自动字符分割训练图像时,用户可决定未适当地分割图像并且然后可输入训练的字符串。用户可选择自动分割按钮。用户面对状态条并且等待完成自动分割。用户面对一系列自动分割结果,并且可通过在其上进行点击来检查每个结果。选择结果,可更新在图像上的分割标记。用户选择最佳结果并选择‘OK’。产生一个新的自动调谐记录,并且使用新的自动调谐设置来更新该图像。使用最近训练的字符来更新字体。 

在一些实施方式中,在通过手动字符分割训练图像时,用户可决定未适当地分割图像。此时,用户可输入训练的字符串并选择手动分割按钮。隐藏自动调谐对话框,并且显示控制面对在训练字符串中用于每个字符的 可编辑区域。然后,用户可定位每个区域并调整其大小。用户在工具条上点击OK(或双击图像)。现在,用户可面对状态条并且等待完成分割设置。该处理完成,并且状态条关闭。产生一个新的自动调谐记录,并且使用新的自动调谐设置来更新该图像。使用最近训练的字符来更新字体。 

在一些实施方式中,用户可决定适当地分割图像,但是错误地识别字符。然后,用户输入训练的字符串并点击‘训练字体’按钮。使用最近训练的字符来更新字体。 

在一些实施方式中,用户可决定适当地分割图像,并且正确地识别字符。此为与其他图像差别不大的测试图像。不需要用户活动。 

在一些实施方式中,用户可决定适当地分割图像,并且正确地识别字符。用户确定该图像为在进行自动调谐时应考虑的重要图像,并且可选择‘产生记录’按钮。使用当前的图像与当前的分割区域来产生新的自动调谐记录。 

在一些实施方式中,自动调谐为多图像处理,该处理在工具内设置分割参数并且可选地重新训练字符。在自动调谐处理活动时,要求用户加载图像并为每个图像评估结果。用户在视觉上确定是否正确地分割字符以及是否正确地识别字符。如果未正确地分割或识别字符,则自动调谐算法试图进行纠正。随着处理的继续,这些结果变得更加可靠精确。在满足用户时,应用新的分割设置,并且使用最近训练的字符更新字体。 

在一些实施方式中,自动调谐处理跨越多个图像。用户能够加载图像并且调整检查区域,无需关闭自动调谐对话框。在本文中所描述的实施方式可为用户提供通过播放控制加载图像、从磁盘中加载图像或者通过现场采集加载图像的方法,无需关闭自动调谐对话框。实施方式也可为用户提供编辑嵌入式区域的方法,无需关闭自动调谐对话框。 

在一些实施方式中,在自动调谐处理起作用时,用户评估在每个图像中的字符分割。如果未正确地分割字符,则自动调谐算法试图进行纠正。自动调谐处理可需要处理与文本有关的信息,并且提供一些性能(速度与精度)调整。 

在本文中所公开的实施方式可为用户提供多个自动调谐选项。一些选项包括但不限于锁定的参数列表,该列表可规定不应由自动调谐修改的一组分割参数。未默认锁定任何参数。图像分辨率:例如,可通过全分辨率或通过子采样分辨率分割字符。可设置默认值。结果数量:可识别要生成并且呈现给用户的最大数量的候选结果。参数步骤:例如,试图用于每个分割参数的迭代次数。如果在链接选项卡中链接相关的工具输入,则自动锁定参数。 

在一些实施方式中,在当前的图像未正确分割时,用户可选择运行自动分割算法。自动分割算法搜索并返回一系列分割配置,这些分割配置正确地分割当前的图像以及在这系列自动调谐记录中的图像。将这系列返回的配置呈现给用户,并且用户选择最佳分割字符的配置。如果由用户选择满意的配置,则将该验证的结果作为新的自动调谐记录储存,并且所选择的配置用于分割以后的图像。此外,通过最近训练的字符,更新字体。如果没有令人满意的配置,则用户可选择:修改自动分割输入并且重新运行自动分割功能,或者通过图形手动分割字符。 

在本文中公开的实施方式可为用户提供用于启动自动分割操作的命令。这并非明确的命令;根据用户在当前图像内将分割分级的方式,可调用该命令。用户必须提供训练的字符串。 

在本文中公开的实施方式可提供状态指示器,以通知用户自动分割处理正在进行并且一切进展顺利。此外和/或或者,在本文中所公开的实施方式可提供在用户手动分割字符之后取消正在进行的自动分割操作的方式。一旦完成取消,用户就应返回到交互式图形显示器中,并且分割图形位于用户放置的位置。 

在本文中公开的实施方式可为用户提供用于从自动分割结果中选择最佳分割配置的选项。此外和/或或者,一些实施方式可为用户提供一种装置,该装置对着用于每个候选配置的当前图像在视觉上检查分割结果。 

如果当前图像未正确分割并且自动分割结果不令人满意,则用户可选择通过图形手动分割字符。手动放置的区域可储存在新的自动调谐记录内。在试图找出满足手动放置的区域的分割配置时,自动分割程序可在内 部运行。根据由用户提供的区域,可自动选择最佳配置;用户不需要从一系列配置中进行选择。通过最近训练的字符,可更新字体。 

此外和/或可选地,在本文中公开的实施方式可为用户提供手动定位每个分割区域的能力。用户必须能够设置每个字符的位置、尺寸、角度以及倾斜。区域的数量可由训练字符串决定,该系统不需要为用户提供增加或去除字符区域的能力。 

一些实施方式可被配置为提供状态指示符,以通知用户该工具正在搜索配置,该处理正在进行,并且一切进展顺利。此外和/或或者,一些实施方式可提供在用户手动分割字符之后取消正在进行的搜索操作的方式。一旦完成取消,用户就应返回到交互式图形显示器中,并且分割图形位于用户放置的位置。 

如上所述,在一些实施方式中,在自动调谐的过程中,训练字符。在自动分割命令之后,自动进行字体训练。如果分割较好,但是错误识别字符,则也可由用户开始字体训练。字体训练选项适用于这两种情况。 

在本文中公开的实施方式可需要与管理经训练的字符的方式有关的某些信息,并且可为用户提供大量字体训练选项,包括但不限于每个字符的最大实例,这可限制要训练的字符的实例数量。在本文中公开的实施方式也可为用户选择提供用于重新训练字符的选项,无需执行自动分割命令。用户必须提供训练的字符串,并且产生自动调谐记录。在稍后的时间,可输出并恢复自动调谐模式数据。这就允许用户训练一组基本图像,随后在遇到新的有问题的图像时,将这些基本图像加入数据集中。用户能够选择保存位置或加载位置。用户可具有将活动会话保持到在任何合适的计算装置上的用户指定的位置的能力。用户能够选择保存位置。用户也可具有恢复先前保存的会话的能力,重写当前的活动会话。用户能够选择加载的位置。在某些情况下,用户希望放弃当前的进度并且重新开始自动调谐处理。用户可具有将自动调谐模式重新设置为新的空状态的能力。 

在一些实施方式中,在训练操作期间,通常自动产生自动调谐记录。如果用于产生记录的图像具有较差的质量并且造成自动调谐机构的问题,则可用于删除该记录。可由用户查看记录。可通过两种方式标记在记录中 的图像:标有训练的区段区域或者标有使用当前的分割设置生成的区段区域。如果当前的分割设置比用于训练该图像的设置更精确地分割记录图像,则用户可通过当前的分割结果选择更新记录。 

一些实施方式可为用户提供用于产生记录的图像,该图像标有验证(训练时间)的分割区域。实施方式可为用户提供用于产生记录的图像,该图像标有使用当前的设置来生成的分割区域。用户可面对用于产生记录的文本。 

在一些实施方式中,用户可通过当前的分割结果删除和/或更新自动调谐记录。此外和/或或者,自动调谐对话框可为用户提供以下选项:OK-全部提交:用户可具有关闭对话框的选项,接受分割参数以及经训练的字体字符。复制分割参数,并且使用经训练的字符更新字体。 

现在参照图28至图29,提供了与本公开的教导内容一致的图形用户界面的实施方式。在该特定的实施方式中,在图28中所示的性能表上的自动调谐按钮可用于激活自动调谐功能。此外和/或或者,如图29中所示,在引用外部设置单元时,可禁用自动调谐按钮。 

现在参照图30至31,提供了描述工具条图形用户界面的本公开的实施方式。一些工具条命令可包括但不限于图像采集命令、检查区域编辑命令、输出命令、输入命令以及清除模型命令。在按压OK或取消按钮时,自动调谐对话框关闭。如果选择OK,则相关单元会发生这些变化。 

现在参照图32至图34,在一些实施方式中,可包括一个或多个选项卡页面。选项卡页面可包括但不限于自动调谐(在图32中所示)、设置、记录以及字体。自动调谐选项卡可提供自动分割命令、手动分割命令以及训练字体命令。设置选项卡可提供到自动调谐设置的访问以及到字体训练选项的访问。如图33中所示,记录选项卡可提供到查看记录、删除记录以及更新记录的访问。在一些实施方式中,选择“查看记录”按钮,会打开以下模式对话框,这允许查看记录并且更新记录。 

如图35至图36所示,在进行一个处理时,会出现模式弹出式窗口。这可提供自动分割进度、配置搜索进度、取消自动分割操作以及取消配置搜索。 

在一些实施方式中,在选择在图34中所示的查看记录选项时,可生成模式对话框,这可允许显示和/或更新记录。图37描述了显示这种配置的图形用户界面3700。如图37中所示,图形用户界面3700可包括均可显示的经训练的功能以及当前的设置功能。也可提供保存当前结果的选项。 

如图38至图39所示,在一些实施方式中,在自动分割处理完成之后,出现模式对话框。对话框可允许用户选择最佳分割配置。在选择‘编辑结果’按钮时,通过将当前的选择用作起始点,用户能够手动标记字符区段图形。在选择‘OK’按钮时,根据当前的选择更新自动调谐模式,并且对话框关闭。如果在列表中选择一个项目,则仅仅启动OK按钮。 

在一些实施方式中,在手动编辑字符区段时,可使用平行四边形图形。平行四边形图形可包括多个功能。例如,在将鼠标放置在平行四边形的内部内时,移动功能会将光标变成标准的移动光标(4个箭头)。然后,通过点击和拖动图形,可移动平行四边形。在将鼠标放置在平行四边形的边缘上时,调整大小的功能会将光标变成标准的调整大小光标(2个箭头)。然后,通过点击和拖动边缘,可调整平行四边形的尺寸。在将鼠标放置在平行四边形的左上角上时,倾斜功能会将光标变成标准的十字型光标。然后,通过点击和拖动该点,可改变平行四边形的内部角度。在将鼠标放置在平行四边形的底部的旋转图标上时,旋转功能(见图40)会将鼠标光标变成旋转光标。然后,通过点击和拖动该点,可修改平行四边形的旋转。允许键盘编辑。除了现有的移动、调整大小以及旋转模式,还可使用倾斜模式。倾斜模式在1度增量(左箭头-1,右箭头+1)中调整平行四边形的内角,如图41中所示。在顶部箭头的顶部,拖动在平行四边形的底部边缘和左边缘之间的以角度表示的角。 

现在参照图42,提供与本公开的一个实施方式一致的图形用户界面4200。在该特定的实例中,分割选项卡可包括用户可选的按钮,该按钮称为:“输出到单元”。如果如图43中所示,已经设置外部设置引用,则可禁用输出命令。 

在自动调谐会话的范围内可发生自动调谐功能,部分原因在于自动调谐的高存储器与处理器要求。在会话结束时,释放存储器,并且提交或丢 弃结果。会话为不能暴露给用户的几乎整个内部实现细节。对用户的影响在于,在会话之间未保存中间训练数据(例如,自动调谐记录)。可由用户输入与输出会话数据。在执行任何自动调谐功能之前,在本文中所公开的实施方式可开始新的自动调谐会话。该操作对于用户是透明的,并且在打开自动调谐对话框时,可自动进行该操作。在本文中公开的实施方式可退出每个活动的自动调谐会话。该操作对于用户可为透明的,并且在关闭自动调谐对话框时,可自动进行该操作。 

该方法还可包括使用一个或多个计算装置,根据设置为阈值或优化值的标准,确定所产生的分割是否满足一个或多个标准。该方法还可包括使用所述一个或多个计算装置生成至少部分使用第一字符串和额外的字符串中的一个或多个的字符数据库。该方法还可包括使用一个或多个计算装置接收用于具有一组正确的分割参数的字符串的正确分割的指示。该方法还可包括使用一个或多个计算装置将这组正确的分割参数应用于第二字符串中。在一些实施方式中,识别可包括识别与ASCII均匀性标准的符合性。 

操作还可包括使用一个或多个计算装置,根据设置为阈值或优化值的标准,确定所产生的分割是否满足一个或多个标准。操作还可包括使用所述一个或多个计算装置生成至少部分使用第一字符串和额外的字符串中的一个或多个的字符数据库。该方法还可包括使用一个或多个计算装置接收用于具有一组正确的分割参数的字符串的正确分割的指示。该方法还可包括使用一个或多个计算装置将这组正确的分割参数应用于第二字符串中。在一些实施方式中,识别可包括识别与ASCII均匀性标准的符合性。在一些实施方式中,所述至少一个分割参数可包括一个或多个极性、行细化、角度搜索范围、倾斜搜索范围、标准化模式、笔划宽度、二值化阈值、边界片段、像素数、对比度阈值、字符高度、字符宽度、字符间间隔、字符内间隔、字符片段距离、字符片段合并模式、宽字符分割、最小字符纵横比、字符宽度类型、分析模式、节距度量、节距类型、最小节距、空白插入、空白刻痕、空白字符的最小宽度以及空白字符的最大宽度。 

所述一个或多个处理器可进一步被配置为接收至少一个额外的图像,每个图像具有一个额外的字符串。所述一个或多个处理器可进一步被配置为生成至少部分使用第一字符串和额外的字符串中的一个或多个的字符数据库。所述一个或多个处理器可进一步被配置为接收用于具有一组正确的分割参数的字符串的正确分割的指示。所述一个或多个处理器可进一步被配置为将这组正确的分割参数应用于第二字符串中。在一些实施方式中,识别可包括识别与ASCII均匀性标准的符合性。在一些实施方式中,所述至少一个分割参数可包括一个或多个极性、行细化、角度搜索范围、倾斜搜索范围、标准化模式、笔划宽度、二值化阈值、边界片段、像素数、对比度阈值、字符高度、字符宽度、字符间间隔、字符内间隔、字符片段距离、字符片段合并模式、宽字符分割、最小字符纵横比、字符宽度类型、分析模式、节距度量、节距类型、最小节距、空白插入、空白刻痕、空白字符的最小宽度以及空白字符的最大宽度。 

本领域的技术人员会理解的是,本公开可体现为一种方法、系统或计算机程序产品。因此,本公开可采用以下形式:完全硬件实施方式、完全软件实施方式(包括固件、常驻软件、微码等)或使在本文中均可总体上称为“电路”、“模块”或“系统”的软件与硬件方面相结合的实施方式。而且,本公开可采用以下形式:在计算机可用储存介质上的计算机程序产品,该产品具有在该介质内体现的计算机可用程序代码。 

可利用任何合适的计算机可用或计算机可读介质。计算机可用或计算机可读介质可为例如但不限于电子、磁性、光学、电磁、红外或半导体系统、设备、装置或传播介质。计算机可读介质的更具体的实例(并非详尽的列表)包括以下元件:具有一条或多条电线的电连接、便携式电脑磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)、光纤、便携式光盘只读存储器(CDROM)、光存储装置、传输介质(例如,支持互联网或内联网的传输介质)或磁存储装置。要注意的是,由于通过例如光学扫描纸张或其他介质,可通过电子的方式捕捉程序,然后如有必要,通过一种合适的方式,编译、解释或另外处理该程序,并且然后将该程序储存在计算机存储器内, 所以计算机可用或计算机可读介质甚至可为在其上打印程序的纸张或另一种合适的介质。在本文的背景中,计算机可用或计算机可读介质可为可包含、储存、传送、传播或输送供指令执行系统、设备、或装置使用或者与其连接的程序的任何介质。计算机可用介质可包括在基带内或者作为载波的一部分与计算机可用程序代码一起实现的传播数据信号。使用任何合适的介质(包括但不限于互联网、钢丝绳、光纤电缆、射频等),可传输计算机可用程序代码。 

可用面向对象的编程语言(例如,Java、Smalltalk、C++等),编写用于执行本公开的操作的计算机程序代码。然而,也可用传统的程序编程语言(例如,“C”编程语言或相似的编程语言),编写用于执行本公开的操作的计算机程序代码。程序代码可完全在用户的计算机上,部分在用户的计算机上,作为独立软件包,部分在用户的计算机上并且部分在远程计算机上,或者完全在远程计算机或服务器上执行。在后一种情况下,远程计算机可通过局域网(LAN)或广域网(WAN)连接至用户的计算机,或者可连接至外部计算机(例如,使用互联网服务提供商通过互联网)。 

下面根据本公开的实施方式,参照流程图插图和/或方法、设备(系统)以及计算机程序产品的框图,描述本公开。要理解的是,流程图插图和/或方框图的每个方框以及在流程图插图和/或方框图中的方框的组合可由计算机程序指令实现。可将这些计算机程序指令提供给通用计算机、专用计算机或其他可编程的数据处理设备的处理器,以制造机器,从而这些指令通过计算机或其他可编程的数据处理设备的处理器执行时,产生用于实现在流程图和/或方框图的一个或多个方框中规定的功能/行为的装置。 

这些计算机程序指令也可储存在计算机可读存储器内,该存储器可引导计算机或其他可编程的数据处理设备通过一种特定的方式运行,从而储存在计算机可读存储器内的指令产生制品,该制品包括实现在流程图和/或方框图的一个或多个方框中规定的功能/行为的指令装置。 

也可在计算机或其他可编程的数据处理设备上加载计算机程序指令,以促使在计算机或其他可编程的设备上执行一系列操作步骤,以产生计算 机实现处理,从而在计算机或其他可编程的设备上执行的指令提供用于实现在流程图和/或方框图的一个或多个方框中规定的功能/行为的步骤。 

在视图中的流程图和方框图根据本公开的各种实施方式示出了系统、方法以及计算机程序产品的可能的实现方式的架构、功能以及操作。就这一点而言,在流程图或方框图中的每个方框可表示代码的模块、区段或部分,其包括用于实现规定的逻辑功能的一个或多个可执行的指令。还应注意的是,在一些替换的实现方式中,在方框中记录的功能可按照与在图中记录的顺序不同的顺序发生。例如,根据有关功能,实际上可基本上同时地执行连续显示的两个方框,或者有时可按照相反的顺序执行这些方框。还要注意的是,方框图和/或流程图插图的每个方框以及在方框图和/或流程图插图中的方框的组合可由基于专用硬件的系统实现,这些系统执行规定的功能或行为或专用硬件与计算机指令的组合。 

在本文中所使用的术语用于仅仅描述特定的实施方式,并非旨在限制本公开。在本文中所使用的单数形式“a”、“an”以及“the”旨在也包括复数形式,除非上下文另有明确说明。进一步要理解的是,在用于本说明书中时,术语“comprises”和/或“comprising”规定具有所陈述的功能、整体、步骤、操作、部件和/或元件,但是不排除具有或添加一个或多个其他功能、整体、步骤、操作、部件、元件和/或其组。 

根据特别的要求,在下面权利要求中的所有装置或步骤加功能部件的相应结构、材料、行为以及等同物旨在包括用于与其他所要求的部件相结合地执行功能的任何结构、材料或行为。为了进行说明和描述,已经提供了本公开的说明书,但是本说明书在所公开的形式上并非旨在具有详尽性或限于本公开。在不背离本公开的范围和精神的情况下,很多修改与变化对于本领域的技术人员显而易见。选择并描述该实施方式,以便最佳地解释本公开的原理与实际应用,并且由于各种实施方式进行适合于预期的特定使用的各种修改,从而使本领域的其他技术人员能够理解本公开。 

已经这样详细地描述本申请的公开内容,并且通过引用其实施方式,在不背离在所附权利要求内定义的本公开的范围的情况下,显然能够进行修改与变更。 

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号