首页> 中国专利> 文字图像校正方法和装置

文字图像校正方法和装置

摘要

本发明公开了一种文字图像校正方法,同时公开了相应的文字图像校正装置。该方法所使用的行向累积曲线的频率信息对倾斜角补偿角度和真实倾斜角之前的误差敏感,具有很好的鲁棒性。利用本发明,可以较准确地估计出倾斜角的补偿角度,并且校正倾斜的文字图片。本发明可以应用到图像预处理、扫描文字图像角度自动补偿,手机拍照倾斜角自动补偿等场景中。

著录项

  • 公开/公告号CN112241737A

    专利类型发明专利

  • 公开/公告日2021-01-19

    原文格式PDF

  • 申请/专利权人 瞬联软件科技(北京)有限公司;

    申请/专利号CN202011262934.4

  • 发明设计人 邓元策;

    申请日2020-11-12

  • 分类号G06K9/32(20060101);G06K9/44(20060101);

  • 代理机构11381 北京汲智翼成知识产权代理事务所(普通合伙);

  • 代理人陈曦;贾兴昌

  • 地址 100102 北京市朝阳区望京利泽中园101号启明国际大厦12层

  • 入库时间 2023-06-19 09:36:59

说明书

技术领域

本发明涉及一种文字图像校正方法,同时涉及相应的文字图像校正装置,属于图像校正技术领域。

背景技术

随着数字技术的发展和数字办公系统的普及,在工作或者日常生活中,人们常常使用手机拍摄纸质文件,直接共享给他人;或者上传至业务系统进行进一步自动的校验、识别等后续处理。拍照分享文件让人们的生活更加便利、业务办理更加简化和智能。

但是在拍摄纸质文件的过程中,因为人为或非人为的原因,很容易导致拍摄所得的文件图片中的文字倾斜。这种文字倾斜的文件图片会影响打印出来的阅读效果,或者在上传至业务系统后,给后续处理造成困难,甚至完全不能被校验和识别。

发明内容

本发明所要解决的首要技术问题在于提供一种文字图像校正方法。

本发明所要解决的另一技术问题在于提供一种文字图像校正装置。

为了实现上述目的,本发明采用下述的技术方案:

根据本发明实施例的第一方面,提供一种文字图像校正方法,包括如下步骤:

将待校正图像预处理为二值图像;

以预定步长,将二值图像按同一方向依次旋转,在每次旋转后,记录累积旋转角度,并计算当前二值图像的行向累积量,直至当前二值图像旋转至阈值角度;

针对每张二值图像的行向累积量提取满足预设条件的频率;

在各二值图像满足预设条件的各频率中,将最高频率所对应的累积旋转角度,作为补偿角度对待校正图像进行校正。

其中较优地,所述将待校正图像预处理为二值图像,具体包括:

转化待校正图像为灰度图像;

基于最大类间差法,将灰度图像转化为二值图像。

其中较优地,所述计算当前二值图像的行向累积量,具体包括:

针对当前二值图像,计算每一行的行向累积量;

将各行的行向累积量按顺序构建列向量S

所述每一行的行向累积量的计算式为:

上式中,

其中较优地,所述针对每张二值图像的行向累积量提取满足预设条件的频率,具体包括:

针对当前二值图像的行向累积量,进行滑动窗平滑滤波,得到对应滤波序列Q

对滤波序列Q

针对去均值序列H

提取离散序列P

其中较优地,所述滤波序列Q

上式中,

其中较优地,所述去均值序列H

上式中,

其中较优地,所述离散序列P

上式中,

其中较优地,所述满足预设条件的频率f

上式中,Fs为当前二值图像的行向累积量的采样率,

其中较优地,所述将二值图像按同一方向依次旋转的计算式为:

上式中,

根据本发明实施例的第二方面,提供一种文字图像校正装置,包括处理器和存储器,所述处理器读取所述存储器中的计算机程序,用于执行以下操作:

将待校正图像预处理为二值图像;

以预定步长,将二值图像按同一方向依次旋转,在每次旋转后,记录累积旋转角度,并计算当前二值图像的行向累积量,直至当前二值图像旋转至阈值角度;

针对每张二值图像的行向累积量提取满足预设条件的频率;

在各二值图像满足预设条件的各频率中,将最高频率所对应的累积旋转角度,作为补偿角度对待校正图像进行校正。

与现有技术相比较,本发明所提供的文字图像校正方法和装置可以较准确地估计出倾斜角的补偿角度,并且校正倾斜的文字图片。本发明可应用到图像预处理、扫描文字图像角度自动补偿,手机拍照倾斜角自动补偿等场景中。

附图说明

图1为本发明实施例提供的文字图像校正方法的流程图;

图2为本发明实施例中,图像校正过程的流程示意图;

图3为本发明实施例中,提取二值图像行向累积量频率的流程示意图;

图4(a)为本发明实施例中,二值图像旋转0.5度后的示例图;

图4(b)为本发明实施例中,二值图像旋转0.5度后行向累积变量的频率分析曲线;

图4(c)为本发明实施例中,二值图像旋转0.5度后行向累积变量的变化曲线;

图5(a)为本发明实施例中,二值图像旋转8.5度后的示例图;

图5(b)为本发明实施例中,二值图像旋转8.5度后行向累积变量的频率分析曲线;

图5(c)为本发明实施例中,二值图像旋转8.5度后行向累积变量的变化曲线;

图6(a)为本发明实施例中,二值图像旋转69.5度后的示例图;

图6(b)为本发明实施例中,二值图像旋转69.5度后行向累积变量的频率分析曲线;

图6(c)为本发明实施例中,二值图像旋转69.5度后行向累积变量的变化曲线;

图7为本发明实施例中,累积旋转角度和对应二值图像行向累积量的关系曲线;

图8为本发明实施例提供的文字图像校正装置的结构示意图。

具体实施方式

下面结合附图和具体实施例对本发明的技术内容进行详细具体的说明。

如图1所示,本发明实施例提供的文字图像校正方法,主要包括如下步骤:

101、将待校正图像预处理为二值图像;具体地:

1011、转化待校正图像为灰度图像;

如图2所示,读取待校正图像(原文字图像)D

一般情况下,待校正图像D

按下式,将待校正图像D

D

式(1)中,R/G/B分别代表原彩色图像D

式(2)中,r

1012、基于最大类间差法,将灰度图像转化为二值图像。

获取到灰度图像D

式(3)中,

最大类间差方法又名Ostu方法,是一个经典的常用的阈值选择算法。其通过统计整个图像的直方图特性来实现全局阈值T的自动选取,其算法步骤为:

Step1、先计算图像的直方图,即将图像所有的像素点按照0~255共256个bin,统计落在每个bin的像素点数量;

Step2、归一化直方图,也即将每个bin中像素点数量除以总的像素点;

Step3、i表示分类的阈值,也即一个灰度级,从0开始迭代;

Step4、通过归一化的直方图,统计0~i灰度级的像素(假设像素值在此范围的像素叫做前景像素)所占整幅图像的比例w0,并统计前景像素的平均灰度u0;统计i~255灰度级的像素(假设像素值在此范围的像素叫做背景像素)所占整幅图像的比例w1,并统计背景像素的平均灰度u1;

Step5、计算前景像素和背景像素的方差g=w0*w1*(u0-u1)(u0-u1);

Step6、i++;转到4,直到i为256时结束迭代;

Step7、将最大g相应的i值作为图像的全局阈值。

102、以预定步长,将二值图像按同一方向依次旋转,在每次旋转后,记录累积旋转角度,并计算当前二值图像的行向累积量,直至当前二值图像旋转至阈值角度;

为了提取不同旋转角度下的图像文字和留白的分布信息,需要将二值图像D

如图3所示,以角度为θ

在本发明的一个实施例中,同一方向为顺时针方向或逆时针方向。由于待校正图像D

在本发明的一个实施例中,步长θ

式(4)中,

得到旋转后的二值图像后,就可计算该图像的行向累积量,记为S

1021、针对当前二值图像,计算每一行的行向累积量;

所述每一行的行向累积量的计算式为:

式(5)中,

1022、将各行的行向累积量按顺序构建列向量S

假设在本发明的一个实施例中,待校正图像D

103、针对每张二值图像的行向累积量提取满足预设条件的频率;具体地:

1031、针对当前二值图像的行向累积量,进行滑动窗平滑滤波,得到对应滤波序列Q

如图3所示,为了防止图像噪点的影响,首先对当前二值图像D

式(6)中,

在本发明的一个实施例中,当滑动窗超出S

1032、对滤波序列Q

为了防止直流信号对后续的频率分析的影响,对滤波序列Q

式(7)中,

1033、针对去均值序列H

对去均值序列H

式(8)中,

在本发明的一个实施例中,离散序列P

1034、提取离散序列P

提取P

所述满足预设条件的频率f

式(9)中,Fs为当前二值图像的行向累积量的采样率,

提取当前二值图像D

θ

进入下一个二值图像D

104、在各二值图像满足预设条件的各频率中,将最高频率所对应的累积旋转角度,作为补偿角度对待校正图像进行校正。

理想情况下,如果二值图像中文字没有倾斜,则对应的图像的行向累积曲线应该是按图5(c)规律振荡的趋势,具有很好的频率特性。反之,如果可以在不同的旋转角度下提取出图像行向累积曲线的频率信息,也可以估计出文字的倾斜角度。

将各二值图像的输出向量F

在获取补偿角度

式(12)中,

在本发明的一个实施例中,待校正图像D

以下结合应用实例,对上述技术方案进行详细说明:

获取待校正图像D

当二值图像D

将二值图像D

将二值图像D

如图7所示,最高点表示θ

由此可知,在二值图像D

为实现本发明所提供的文字图像校正方法,本发明还提供一种文字图像校正装置。如图8所示,该文字图像校正装置包括处理器82和存储器81,还可以根据实际需要进一步包括通信组件、传感器组件、电源组件、多媒体组件及输入/输出接口。其中,存储器、通信组件、传感器组件、电源组件、多媒体组件及输入/输出接口均与该处理器82连接。

在上述文字图像校正装置中,所述处理器82读取所述存储器81中的计算机程序,用于执行以下操作:

将待校正图像预处理为二值图像;

以预定步长,将二值图像按同一方向依次旋转,在每次旋转后,记录累积旋转角度,并计算当前二值图像的行向累积量,直至当前二值图像旋转至阈值角度;

针对每张二值图像的行向累积量提取满足预设条件的频率;

在各二值图像满足预设条件的各频率中,将最高频率所对应的累积旋转角度,作为补偿角度对待校正图像进行校正。

本发明所提供的文字图像校正方法和装置可以较准确地估计出倾斜角的补偿角度,并且校正倾斜的文字图片。所使用的行向累积曲线的频率信息对倾斜角补偿角度和真实倾斜角之前的误差敏感,具有很好的鲁棒性。本发明可以应用到图像预处理、扫描文字图像角度自动补偿,手机拍照倾斜角自动补偿等场景中。

上面对本发明所提供的文字图像校正方法和装置进行了详细的说明。对本领域的一般技术人员而言,在不背离本发明实质内容的前提下对它所做的任何显而易见的改动,都将构成对本发明专利权的侵犯,将承担相应的法律责任。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号