首页> 中国专利> 在大型扫描系统中借助图像信息探测文档的宽度和位置的方法

在大型扫描系统中借助图像信息探测文档的宽度和位置的方法

摘要

本发明涉及一种用于借助所记录的图像信息在大型扫描系统(1)中识别文档(4)的宽度和位置的方法,其中所述扫描系统(1)具有用于记录图像信息的图像检测元件(2)、布置在图像检测元件之前的光学系统(3)和与图像检测元件(2)相对置的反射器(5),具有以下步骤:S1预处理所记录的图像信息以减少由于光学系统(3)和反射器(5)的污染而导致的干扰,S2粗略识别从反射器(5)到所述文档(4)的水平和/或竖直过渡区域(12,13),以及S3在通过根据步骤S2的粗略识别探测到的过渡区域(12,13)内精细识别水平和/或竖直的文档边缘(10,11)。

著录项

  • 公开/公告号CN103688528A

    专利类型发明专利

  • 公开/公告日2014-03-26

    原文格式PDF

  • 申请/专利权人 罗思+韦伯有限责任公司;

    申请/专利号CN201280023464.3

  • 发明设计人 S.肯普弗莱茵;B.舍尔彭;

    申请日2012-05-05

  • 分类号H04N1/00;

  • 代理机构中国专利代理(香港)有限公司;

  • 代理人臧永杰

  • 地址 德国下德赖斯巴赫

  • 入库时间 2023-12-17 02:34:24

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-08-17

    授权

    授权

  • 2014-04-23

    实质审查的生效 IPC(主分类):H04N1/00 申请日:20120505

    实质审查的生效

  • 2014-03-26

    公开

    公开

说明书

技术领域

本发明涉及用于借助所记录的图像信息在大型扫描系统中识别和探测文档的宽度和位置的方法,所述大型扫描系统例如是贯穿式扫描仪(Durchzugsscanner),其中该扫描系统具有用于记录图像信息的图像检测元件——例如CI传感器、布置在图像检测元件之前的光学系统和与图像检测元件相对置的反射器。

背景技术

已知通过安置在文档输送系统中的附加传感器——例如反射光栅——求得文档宽度的方法。识别精度在此通过传感器的布置和数量限制。该方法因此仅适用于识别有限数量的格式,例如各种DIN格式。

在具有中央设备而无用于将文档居中安放的机械辅助装置的扫描仪情况下,除了文档的宽度之外还必须求得位置,以使得操作者能够以一定的容差来安放文档。这使得上述方法的使用即使在待识别格式的数量有限的情况下也是不可使用的,因为识别精度即使在光栅的数量高的情况下也是小的。

除此之外还已知多种通过分析图像信息来求得文档宽度的方法。为此利用扫描仪的图像检测元件记载正面的文档区域,包括文档的正边缘和侧边缘。这可以通过在实际扫描之前的预扫描来进行或者通过以下方式实现,即以最大扫描宽度检测整个文档并且接着从图像数据中提取正面区域。这些方法的优点是无需附加的传感器来用于探测文档宽度。

为了从这些图像数据中求得文档的宽度,必须决定哪些图像点属于文档以及哪些属于背景和/或反射器。这种类型的问题在图像处理的领域中被称为分割。

用于分割的已知方法和可用于识别宽度的方法是“阈值方法”,该阈值方法建立在基于亮度的识别基础上。图像点在此由于其亮度或颜色而被分配给文档或反射器。位于最远的左侧或右侧并且被分类为文档像素的像素被解释为反射器与文档之间的过渡并由此可以确定文档的宽度和位置。在该方法中充分利用了反射器、确实已知的反射器辊的颜色或亮度一般不与文档的颜色或亮度一致。

但是在实践中出现一系列干扰,这些干扰导致该方法当使用用于在大型扫描仪中识别宽度时非常小的命中率:

· 反射器(一个或多个反射器辊)的污染,

· 例如玻璃片的光学系统的污染,以及

· 随着玻璃片与反射器辊之间的空隙增大,反射器的亮度值改变,该改变尤其是在文档的情况下以更大的强度出现。

该方法的另一缺点是,反射器的颜色和/或亮度必须与文档的颜色和/或亮度不同。但是与宽度识别无关地,白色的反射器被证明是有利的,因为该白色的反射器在被扫描的图像中例如当在文档中穿孔等时显现为白色并由此与大多显露出来的文档背景(纸张白色)对应。即使在透明原稿的情况下,白色的反射器也是最佳的。但是在通过阈值方法识别宽度的上下文中,在此产生以下问题:反射器颜色和/或反射器亮度与文档颜色和/或文档亮度尤其是在边界区域中一般不区分或几乎不区分。由此该方法在这些前提条件下不可使用。

除此之外还已知用于分割的所谓面向边缘的方法。在这些方法中,在图像中搜索一般表示对象过渡的边缘。在所述应用情况下,这样的对象过渡出现在文档与反射器之间,于是这样的对象过渡通过该方法被识别为边缘。即使反射器和文档拥有相同的亮度或颜色时这些边缘也出现,因为在具有CI传感器(Contact Image Sensor,接触图像传感器)的扫描仪情况下通过将照射源布置在反射器与文档之间的过渡处产生阴影。这是该方法相对于前面所提到的阈值方法的大优点。为了求得文档宽度,该方法必须求得在原稿左侧和右侧的垂直的纸张边缘。

但是在实践中在这些方法的情况下也非常频繁地发生错误识别,因为经常在反射器与文档之间的过渡处的边缘比通过干扰产生的所谓“视在边缘”微弱。

这些干扰通过

· 反射器(一个或多个反射器辊)的污染以及

· 光学系统(例如玻璃片)的污染

产生。

尤其是反射器的污染在实践中可能无法避免并且在具有非驱动的、级联形布置的反射器辊的扫描仪情况下导致垂直的“视在边缘”,因为各个反射器辊在扫描期间不被置于旋转中。这些“视在边缘”是在反射器辊和/或玻璃片上的竖直条,其由于在反射器辊和/或玻璃片上方移动的扫描原稿的磨损而导致。

此外,在具有多重照射的现代CI传感器情况下,在反射器与文档之间的垂直过渡处仅产生非常微弱的阴影投射,并因此仅导致非常微弱的垂直边缘。

除此之外还已知基于模型的方法。在此基于对象的模型在图像中执行搜索。在宽度识别时,在此提供用于搜索边角的模型。该方法相对于前面描述的面向边缘的方法来说对干扰更为鲁棒。但是该方法具有以下缺点:由于折角或破裂而不与边角模型对应的文档未被正确识别。此外,在该方法与仅在垂直的文档边缘处产生非常小的阴影投射的具有多重照射的现代CI传感器组合的情况下也频繁地发生错误识别。

发明内容

本发明所基于的任务是,使得在开头所述类型的扫描方法中,在从文档到反射器的过渡处仅最小阴影形成的情况下、在文档与反射器之间小的亮度差异的情况下和在通过污染的反射器或光学系统引起的干扰的情况下以及在折角和/或破裂的边角的情况下也可以实现可靠的识别。

该任务根据本发明对于开头所述类型的方法通过在权利要求1中说明的特征解决。有利的实施方案在从属权利要求中说明。

该任务根据本发明通过以下步骤解决:

S1预处理所记录的图像信息以减少由于光学系统和反射器的污染而导致的干扰,

S2粗略识别从反射器到文档的水平和/或竖直的过渡区域,以及

S3在通过根据步骤S2的粗略识别探测到的过渡区域内精细识别水平和/或竖直的文档边缘。

通过边缘的该逐级探测,在从文档到反射器的过渡处仅最小阴影形成的情况下、在文档与反射器之间小的亮度差异的情况下以及在通过污染的反射器或光学系统引起的干扰的情况下也可以实现可靠的识别。

以有利的方式,根据步骤S1的预处理可以具有以下子步骤:

S1a在文档到达反射器上之前在水平过渡区域的正面区域中对每个图像列形成像素的平均值,用以在文档到达反射器上之前产生平均值行以及求得水平过渡区域的整个正面区域的平均值,

S1b针对每个图像列从针对该图像列的相应开头的像素平均值与针对该图像列的相应末端的像素平均值的偏差和相应图像列的标准偏差的大小中求得加权因子,

S1c在考虑所述加权因子和水平过渡区域的平均值的情况下计算新的图像。

被证明有利的是,根据步骤S2的过渡区域的粗略识别具有以下子步骤:

S2a将扫描图像在竖直方向上划分为均匀的图像条(1至n个像素),

S2b求得每个图像条的统计参量,

S2c在图像条中检查扫描图像与固定阈值的偏差,使得当值、即图像条的统计参量之一超过阈值时,将该区域识别为反射器与文档之间的竖直过渡区域,

S2d通过逐行地形成平均值并且求得足够强和陡峭的边缘来检查图像条以确定水平过渡区域。

根据本发明,根据步骤S2b和S2c的每个图像条的统计参量可以是平均值和/或标准偏差。

当图像条根据本发明从垂直逐步地转动直至90°、优选45°的角度时,具有折角和/或破裂的边角的文档也可以被可靠识别。

以有利的方式,根据步骤S3的文档边缘的精细识别可以具有以下子步骤:

S3a借助用于探测边缘的方法在过渡区域内探测水平的和/或竖直的文档边缘,以及

S3b借助阈值比较求得第一边缘。

根据本发明,根据步骤S3的文档边缘的精细识别还可以具有以下其它子步骤:

S3c如果利用根据子步骤S3b的阈值比较没有找到边缘,则使用最强边缘。

被证明有利的是,布置在用于记录图像信息的图像检测元件之前的光学系统是文档设备,例如玻璃片,和/或相对于图像检测元件布置的反射器是按压和反射器辊。

附图说明

下面借助在附图中示出的实施例更详细阐述本发明。其中:

图1示出具有图像检测元件和反射器辊的扫描系统,

图2示出具有级联形布置的图像检测元件的扫描系统,

图3示出用于探测文档宽度的本发明方法流程,以及

图4示出用于探测文档宽度的本发明方法流程的流程图。

具体实施方式

在图1中示出具有图像检测元件2的扫描系统1,在该图像检测元件2之前布置玻璃片3。文档4通过反射器辊5借助弹簧5压向该玻璃片3。弹簧6在此以力的方式作用于反射器辊5的侧区域7并且由此将反射器辊5按压在文档4上。反射器辊5的侧区域7如在此所示的可以配备有侧挡板,所述侧挡板具有比反射器辊5的中心区域8更大的直径。由此在反射器辊5与玻璃片3之间在中心区域8中形成间隙9,该间隙具有确保文档4被最佳地安放在玻璃片3处的所定义的大小。另一方面,在反射器辊5的中心区域8中的间隙9负责用于文档4的足够的空间。当然也可以应用按照其它方式构成的反射器辊。

在图2中以俯视图示出具有4个为了扫描大型文档而级联地或锯齿形布置的图像检测元件2的扫描系统1。但是,在此例如也可以使用连续式图像检测元件。向每个图像检测元件2分配反射器辊5。文档4具有正边缘10和侧边缘11。在文档4的正边缘10之前,开始从反射器或反射器辊5到文档4的水平过渡区域12。在文档4的侧边缘11的区域中,存在从反射器辊5到文档4的竖直过渡区域13。

下面借助图3更详细阐述本发明主要方法步骤,其中该方法具有3个主步骤。

在第一主步骤S1中对所记录的并且由图像检测元件2检测的图像信息进行预处理,以减小由于例如玻璃片3的光学系统和例如反射器辊5的反射器的污染而导致的干扰。作为第二主步骤S2,对文档4与反射器辊5之间的水平和/或竖直过渡区域12和13进行粗略识别。在进一步的主步骤S3中,引起在通过根据步骤S2的粗略识别所探测的、在文档4与反射器辊5之间的过渡区域12和13内精细识别水平和/或竖直的文档边缘10和11,以作为从反射器辊5到文档4的过渡精确识别文档4的正边缘10和侧边缘11。

这三个主步骤可以根据本发明再次被分为以下分步骤或子步骤:

在预处理的主步骤S1的第一子步骤S1a中,在文档4到达反射器辊5上之前在水平过渡区域12的正面区域中对每个图像列(S)求得像素的平均值,以产生平均值行(ZM)。此外求得整个水平过渡区域12的平均值(M)。

作为第二子步骤S1b,依据图像列的正面图像区域和其余图像区域的平均值的偏差以及所有列的标准偏差的大小为每个图像列求得加权因子。

在进一步的子步骤S1c中,在考虑水平过渡区域(12)、即整个正面区域的加权因子(W)和平均值(M)的情况下计算新的图像。

在第二主步骤S2、即粗略识别的第一子步骤S2a中,将扫描图像在竖直方向上划分为均匀的图像条14。

作为第二子步骤S2b,为每个图像条14求得统计参量,其中可以计算平均值和/或标准偏差。

在进一步的子步骤S2c中,在图像条14中检查扫描图像与固定阈值的偏差,使得当值、即图像条14的统计参量之一超过该阈值时,将该区域识别为反射器辊5与文档4之间的竖直过渡区域13。

作为第三主步骤S3、即精细识别的第一子步骤S3a,借助用于探测边缘的方法在过渡区域12和13内识别水平和/或竖直文档边缘10和11。

在进一步的子步骤S3b中,接着借助阈值比较求得第一边缘,如下面还要描述的。

如果利用根据子步骤S3b的阈值比较没有找到边缘,则可以在第三子步骤S3c中使用所求得的文档边缘中的最强文档边缘。

在图4中示出用于探测文档宽度的本发明方法流程的流程图。在扫描区域15中,可以借助于边角识别文档4,在所述文档的文档边缘10和11处产生阴影投射16。由于静止的反射器辊5或光学系统/玻璃片3的污染而产生的条状干扰17在文档4之外在外部被检测,而由于旋转的反射器辊5的污染而产生的点状干扰18在文档4之外在内部区域中被检测。

在上述预处理19之后,在竖直取向的图像条14之一内的粗略识别中同时求得平均值20、标准偏差21和行平均值22。基于行平均值22执行竖直边缘探测23。这三个值20,21和23被分别与阈值比较并且基于该比较执行“达到阈值?”的询问24。在“否”的情况下用“下一个图像条”25更换到下一个图像条14并且重新执行分析20至23。在是的情况下,在支路24之后是“粗略识别结束”26。

然后更换到精细识别27,在该精细识别中从图像条14出发首先探测水平边缘28,例如文档边缘10的阴影投射16,并接着探测竖直边缘29,例如文档边缘11的阴影投射16,其中所述图像条14是在粗略识别中通过以下方式探测到的,即在该图像条的情况下达到阈值。该精细识别的结果30是文档边角的标记31。如果该过程也对另外的文档边角执行,则从这些说明中可以计算和说明文档4的宽度和位置。

借助大型扫描系统1的图像检测元件2记录的文档4的正面区域的图像信息用作用于在大型贯穿式扫描仪中探测文档宽度和位置的输入数据,该正面区域具有正边缘10和侧边缘11。

因此该方法可以被分为3个子步骤,这些子步骤通过上级算法、即各个子步骤的相继的处理而相互逻辑连接:

· 预处理,以减少通过反射器(反射器辊5)和光学系统(玻璃片3)的污染而导致的干扰,

· 在图像条14内对文档4与反射器辊5之间的过渡区域12和13的粗略识别,以及

· 在通过粗略识别围绕的区域内的精细识别、即在所探测的图像条14内的精细识别,以精确识别文档4的正边缘10和反射器/文档的过渡、即垂直的文档边缘、即文档4的侧边缘11。

预处理

预处理的目标是减少由于扫描系统1的未旋转的反射器辊5和/或光学系统、尤其是玻璃片3的污染而产生的条和/或干扰,以由此减小错误识别的概率。

为了防止在该预处理时减弱或除去垂直的文档边缘,即文档4的侧边缘11,必须存在差异特征。为了获得这一点,在产生输入图像时一起检测在文档4的正边缘10之前的、即文档4与反射器辊5之间的水平过渡区域12的明显区域。于是该方法利用:在文档4与反射器辊5之间的水平过渡区域12内的正面图像区域中还不存在文档4。

为此首先为每个图像列(S)、即具有一个像素宽度的列,在其中肯定还不存在文档4的正面区域中形成在该列(S)中像素的平均值。该结果是具有正面扫描区域中的平均值的图像行,即所谓的平均值行(ZM)。此外,求得文档4与反射器辊5之间的整个水平过渡区域12的平均值。

现在在其余的图像中为每一行分别求得该行的像素与平均值行(ZM)的像素的绝对偏差,并从中在考虑下面描述的加权因子和整个正面区域的平均值的情况下计算新的图像。由此消除在每个图像行中以相同形式出现的、如由被污染的、未旋转的反射器辊5或者光学系统中的污染引起的干扰17。

为了防止不以相同形式作用于每一行的干扰18不导致新的干扰性条,可以通过加权因子影响:列的平均值或正面图像区域的总平均值是否被包含在结果中。加权因子本身对每一列依据列的正面图像区域和其余图像区域的平均值的偏差以及整个列的标准偏差的大小求得。

由此确保在其中干扰18不以相同形式作用于所有图像行的区域中通过该方法不产生新的干扰。如果反射器辊在正面区域中不旋转并且稍后通过文档4被置于旋转中,则这尤其是在通过所述反射器辊5上的污染导致的干扰情况下情况如此,因为在此反射器辊5上的污染不以相同形式作用于所有图像行并且由此不能利用该方法加以消除。这些区域很大程度地保持不变。由于稍后描述的用于探测反射器辊5与文档4之间的过渡的方法基于边缘探测,因此这些更确切地说点状的干扰18不重要。

粗略识别

粗略识别用于快速地、但是以低的精度确定反射器与文档4之间的过渡区域,以尤其是减小用于稍后精细识别的搜索区域。

为此将图像首先在竖直方向上划分为均匀的图像条14。对于每个图像条14确定统计参量——平均值和标准偏差。现在从外面的图像边界出发经历图像条14,并且检查与固定阈值的偏差。如果值、即图像条14的统计参量之一——平均值或标准偏差超过阈值,则该区域被识别为过渡区域13(文档4与反射器辊5之间的竖直过渡区域13)。此外检验随后的图像条14的值是否同样高于阈值,以提高该方法对干扰的鲁棒性。

由此可以在文档4的情况下可靠地识别过渡区域13,所述文档4的颜色和/或亮度与反射器辊5的颜色和/或亮度不同或者在边界区域中具有值得注意的信息内容。

为了还能识别具有与反射器辊5类似的颜色和/或亮度并且在边界区域中没有值得注意的信息内容的文档4,附加地采用基于正边缘10的识别的方法。背景是,在具有多重照射的现代CI传感器情况下也能看见在文档正边缘10处的足够强的阴影投射16。

对于上述图像条14中的每一个,分别逐行地形成平均值。由此由二维图像条14产生一维数据行列。在该数据行列中,利用用于探测边缘的已知方法搜索足够强和陡峭的边缘。为此又从外部的图像区域出发经历图像条14,并且求得具有足够强和陡峭的边缘的第一图像条14。然后假定在此在反射器辊5与文档4之间存在过渡。该方法对于相同形式地作用于所有图像行的干扰是非常鲁棒的,诸如所述干扰可能由于扫描仪的未旋转的反射器辊或光学系统(尤其是玻璃片)上的污染而出现。重要的是在此尤其考虑边缘的“陡峭度”,因为通过改变反射器辊5与玻璃片3之间的空隙的大小,在文档4进入玻璃片3与反射器辊5之间时在文档4旁边的区域中也出现边缘,但是具有较小的“陡峭度”。

此外在其中反射器辊5与文档4之间的过渡已通过前述方法得以识别的区域中,在相邻的区域中探测“歪斜的”正边缘。为此采用前面提到的方法,但是图像条14不与水平线正交相交,而是逐步地转动直至90°,优选45°。由此也可以可靠地识别具有弯折的边角、即所谓的折角或边角区域中的破裂的文档。

精细识别

文档边缘10和11的精细识别通过用于探测边缘的已知方法进行,诸如Sobel算子或Laplace算子。由于搜索区域已经通过粗略识别被强烈限制并且大多数干扰17或18通过预处理得以消除,因此命中率非常高。为了防止文档4中的边缘被错误地识别为反射器辊5与文档4之间的过渡,用阈值求得第一边缘。如果用该阈值没有找到边缘,则使用最强的边缘。由此当原稿在反射器辊5与文档4之间的过渡处具有极弱的边缘时,例如在薄的透明件情况下,也保证良好的识别,因为在这种情况下探测到文档4中的第一边缘,例如在技术图情况下的外框,并且在任何情况下都使用在通过粗略识别(可靠)限制的区域内的值。

该新方法相对于已知方法的优点是,在诸如反射器辊5的反射器与文档4之间的垂直过渡处仅有最小阴影投射16、和在文档4与反射器辊5之间的亮度差异小以及存在通过污染的反射器辊5和光学系统(例如玻璃片3)产生的干扰17和/或18的情况下也进行可靠的识别。具有折角和/或破裂的边角的文档4也可以被可靠地识别。

已经表明,该方法在对图像数据的另外的预处理情况下以及甚至在略去图像数据的预处理的情况下也展示出良好的结果。

附图标记列表

1扫描系统

2图像检测元件

3玻璃片

4文档

5反射器辊

6弹簧

7侧区域

8中心区域

9间隙

10文档的正边缘

11文档的侧边缘

12水平过渡区域

13竖直过渡区域

14图像条

15扫描区域

16文档边缘处的阴影投射

17条状干扰

18点状干扰

19预处理

20平均值

21标准偏差

22行平均值

23边缘探测(竖直)

24询问“达到阈值?”

25下一个图像条

26结束粗略识别

27精细识别

28边缘探测(竖直)

29边缘探测(水平)

30结果

31边角的标记

A偏差

M平均值

S图像列

W加权因子

Z图像行

ZM平均值行。 

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号