首页> 中国专利> 自适应字符切分及提取方法

自适应字符切分及提取方法

摘要

自适应字符切分及提取方法,首先,将读入的图像进行倾斜矫正;然后,从中定位出表格左上角的坐标(x0,y0),并以此设置矩形框裁剪出图像;最后,进行单个字符的切分及提取。本发明结合多种二值化图像的效果,采用基于垂直方向投影和轮廓特征组合下的两种策略多次自适应切分及提取,提高了从图像中定位出来的字符串的切分率,并保证了提取出的待识别数字正确率在98%~100%。

著录项

  • 公开/公告号CN103488986A

    专利类型发明专利

  • 公开/公告日2014-01-01

    原文格式PDF

  • 申请/专利权人 西安理工大学;

    申请/专利号CN201310431987.8

  • 申请日2013-09-18

  • 分类号G06K9/34(20060101);G06K9/32(20060101);

  • 代理机构61214 西安弘理专利事务所;

  • 代理人李娜

  • 地址 710048 陕西省西安市金花南路5号

  • 入库时间 2024-02-19 21:53:09

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-06-01

    专利权的转移 IPC(主分类):G06K9/34 登记生效日:20180514 变更前: 变更后: 申请日:20130918

    专利申请权、专利权的转移

  • 2016-01-27

    授权

    授权

  • 2014-02-05

    实质审查的生效 IPC(主分类):G06K9/34 申请日:20130918

    实质审查的生效

  • 2014-01-01

    公开

    公开

说明书

技术领域

本发明属于计算机数字图像处理技术领域,涉及一种综合使用多知 识决策的自适应字符切分及提取方法。

背景技术

图像二值化是图像处理中最常见的处理方法,是进行图像分析、特 征提取和模式识别之前必要的图像预处理过程。尽管到目前为止,二值 化阈值的选取方法数以百计,但仍没有一个通用的方法对各种各样的图 像都能达到最理像的效果。

OTSU算法,也称大津法,是全局自适应二值化算法的经典算法之一, 由大津于1979年提出,它是建立在一幅图像的灰度直方图基础上,依据 类间距离极大准则来确定区域分割阈值。适用于目标与背景的比例适当 和信噪比高的情况,分割效果较好。

简单统计法是Kittlter等人提出的一种基于简单图像像素灰度梯 度值与图像灰度统计相结合的阈值选取方法。阈值可以一次计算得到, 从而避免了多次迭代分析图像灰度直方图的麻烦,同时也导致了目标与 背景的过度区域做不到非常精确的分割,但针对字符而言可以较好的分 割出笔画所在的主要区域,轮廓的体现较为分明。

随着单个字符识别技术趋于成熟,复杂背景下字符串的切分已经成 为制约数字识别精度的关键。单个字符中内部的间断、字符间的粘连以 及图像背景噪声不同程度的污染等,都是造成字符串不能精确切分的主 要因素。目前,现已提出的切分方法:基于图的连通性切分,基于 SCP(Significant Contour Point)的数字切分,垂直方向像素投影,基 于BFA(Background and Foreground Analysis)的数字切分,上下轮廓 (Upper/Lower Contour)特征,滴水算法(Drop-Falling),LDP(Limited  Dynamic Programming)算法等,其大多是应用在曲线切分上,一般情况 下都需要人工干预选取切分线的起始点,相比之下,机打印刷类的字体 是垂直的,起始点的确定就意味着切分线的建立,因此,这类字体下的 切分难点就在于如何自动选取起始点。现有单一的字符切分算法切分字 符的正确率较低,阻碍了字符识别率的提高。

发明内容

本发明的目的在于提供一种自适应字符切分及提取方法,解决现有 技术存在的识别数字正确率低的问题。

本发明的技术方案是,自适应字符切分及提取方法,首先,将读入 的图像进行倾斜矫正;然后,从中定位出表格左上角的坐标(x0,y0),并以 此设置矩形框裁剪出图像;最后,进行单个字符的切分及提取。

本发明的特点还在于:

单个字符的切分及提取方法包括两种,第一种为:首先,用简单统 计法将灰度位图二值化,并对二值位图进行边缘噪声清理和消除孤立点, 然后,追踪上下轮廓特征,分析空白间隔切除不需要的部分,对保留下 来的部分搜索极值点,进而取特征点处切分。

具体步骤如下:

步骤1:读入原始图像,裁剪并归一化左上角位图;

步骤2:用最大类间方差算法二值化该灰度图,进行霍夫变换,定位 出表格左上角坐标(x0,y0)及倾斜角度angle;

步骤3:若angle不为00,旋转angle角度;

步骤4:以(x0,y0)为矩形左下角,裁剪出目标所在区域位图记为 image0

步骤5:用简单统计法二值化image0记为I1,再消除孤立噪声点,并 进行边缘清理;

步骤6:在I1中用扫描像素的方法定位字符的上下轮廓特征,得到其 间隔的离散值span(1,I1_x),有

span(1,i)=U(1,i)-D(1,i)

其中,I1_x为I1的宽,i初始化为0,上限为I1_x-1,移动步长为1, U(1,I1_x)、D(1,I1_x)分别记录上下轮廓的纵坐标点;自左向右分析span(1,i) 空白间隔处缩小目标所在区域范围,基于灰度位图image0再次切割记为 image1

步骤7:搜索span(1,i)极值点,依据字符粘连处平均高度d从中选取 切分点,基于image1裁剪出字符碎片,用最大类间方差算法二值化;

步骤8:对字符碎片做轮廓临界点裁剪,二次切分自适应提取有效 字符片位图。

单个字符的切分及提取的第二种方法是:用最大类间方差算法二值 化后直接进行垂直方向投影,在无像素累积点处切分,生成日期碎片。

具体步骤如下:

步骤1:读入原始图像,裁剪并归一化左上角位图;

步骤2:用最大类间方差算法二值化该灰度图,进行霍夫变换,定位 出表格左上角坐标(x0,y0)及倾斜角度angle;

步骤3:若angle不为00,旋转angle角度;

步骤4:以(x0,y0)为矩形左下角,裁剪出目标所在区域位图记为 image0

步骤5:最大类间方差法二值化image0,再消除孤立噪声点,并进行 边缘清理;

步骤6:垂直投影空白处切分字符串,生成字符碎片;

步骤7:对字符碎片做轮廓临界点裁剪,二次切分自适应提取有效 字符片位图。

本发明具有如下有益效果:本发明结合多种二值化图像的效果,采 用基于垂直方向投影和轮廓特征组合下的两种策略多次自适应切分及提 取,提高了从图像中定位出来的字符串的切分率,并保证了提取出的待 识别数字正确率在98%~100%。

附图说明

图1是本发明自适应字符切分及提取方法流程图;

图2是本发明自适应字符切分及提取方法定位日期的操作流程图;

图3是本发明自适应字符切分及提取方法实施例1字符切分流程图;

图4是本发明自适应字符切分及提取方法实施例2字符切分流程图;

图5是本发明自适应字符切分及提取方法字符提取流程图;

图6为本发明自适应字符切分及提取方法实施例3的发票源图;

图7为本发明自适应字符切分及提取方法实施例3的左上角位图;

图8为本发明自适应字符切分及提取方法实施例3定位的开票日期 头位图;

图9为本发明自适应字符切分及提取方法实施例3定位日期位图;

图10为本发明自适应字符切分及提取方法实施例3字符碎片位图;

图11为本发明自适应字符切分及提取方法实施例3字符碎片放大位 图;

图12为本发明自适应字符切分及提取方法实施例3提取数字片位 图。

具体实施方式

下面结合具体实施方式和附图对本发明作进一步详细的说明。

实施例1,自适应字符切分与提取方法,流程参见图1,具体实施步 骤包括:

步骤1,读入原始图像,裁剪出左上角位图,从而大大减少后续操 作数据量,并按固定比例大小进行缩放,类似全局归一化的效果,记录此 时高度h0、宽度w0

步骤2,用最大类间方差算法二值化该灰度图,进行霍夫变换检测 表格线和倾斜角度,定位出表格左上角及角度的矫正。具体操作如下: 以位图左下角为坐标原点,将二值图像素值为0的直角坐标系下的坐标 点(x,y)转换为极角坐标下的(r,θ)并累加个数存储于hough矩阵,方程式 为:

r=x×cosθ+y×sinθ

其中,r∈(0,(h02+w02)1/2),θ∈(00,1800),(r,θ)∈hough。

从r=h0-a处开始降序搜索hough矩阵中同(r,θ)数量值,搜索到的第个大 于预设的门限值b时设:

up_dis=r

angle=θ

其中,up_dis为表格最上直线距原点的距离,angle为表格倾斜角度, a、b为常量。

同理,从r=a处升序搜索hough矩阵中同(r,θ)数量值,搜索到的第个 大于预设的门限值c时设:

left_dis=r

其中,left_dis为表格最左边直线距原点的距离,c为常量。

若θ≠0,判断应旋转角度angle及表格左上角坐标(x0,y0),设置如下:

步骤3,邻近插值算法以angle角度对位图进行倾斜矫正。

步骤4,以(x0,y0)为矩形左下角,按固定比例从原灰度图中裁剪出目 标所在区域部分,以上具体流程如图2所示,此时位图矩阵记为image0

步骤5,简单统计法二值化image0,搜索8领域连通域消除孤立噪声 点,并进行边缘清理,记录此时二值位图为I1

步骤6,在I1中定位字符的上下轮廓特征,可采用自上而下和自下而 上纵轴方向扫描像素的点方法,用一维数组U(1,I1_x)、D(1,I1_x)分别记录 上下轮廓的纵坐标点,得到上下轮廓距离的离散值span(1,I1_x),有

span(1,i)=U(1,i)-D(1,i)

其中,I1_x为I1的宽,i初始化为0,上限为I1_x-1,移动步长为1。 分析span(1,i)空白间隔处,并自适应选取缩小目标区域的切割点(x1,y1), 基于image0图裁剪出日期矩阵image1

步骤7,依据先递减后递增的规律从左向右逐一查找span(1,i)中的极 值点,设小于d(注:d为常量)为切分点,基于image1灰度位图裁剪,最 终切分成字符碎片,用最大类间方差算法生成二值化效果图。

步骤8,对字符碎片做轮廓临界点裁剪,二次切分自适应提取有效 字符片位图。首先,统计字符碎片高度、宽度,排序查找出现次数最多 的高度、宽度分别记为ha、wa,其次,鉴于此时二值化位图细节清晰, 只需取上轮廓特征极值点,参考ha、wa及非有效字符的提取情况,自适 应的进行二次切分,直至取到所有有效字符片存于数组矩阵digital_matrix 中,参见图3,图5;

实施例2,自适应字符切分与提取方法,参见图1,具体实施步骤:

步骤1~步骤4同实施例1;

步骤5:用最大类间方差算法二值化image0灰度位图记为I0,再以8 领域连通域搜索消除孤立噪声点,并进行边缘清理。

步骤6:将I0进行垂直投影,投影累加值记录在一维矩阵S(1,I0_x)中, 公式如下:

S(1,i)=Σj=0I0_y-1(1-I0(i,j))

其中,I0_x为I0的宽,I0_y为I0的高,I0(i,j)为在坐标(i,j)下的像素 值(注:0为黑色像素点,1为白色像素点),S(1,i)为在横坐标为i下的所 有像素为0的个数。

基于空白间隔处进行字符切分,得到字符碎片piece_matrix[sum](注: sum为碎片总数)。参见图4。

步骤7:对字符碎片做轮廓临界点裁剪,二次切分自适应提取有效 字符片位图。

实施例3,通过从一张发票中提取单个日期字符来说明自适应字符 串切分与提取方法的实现过程。

步骤1:将任意选取的一张发票图片设为源图,如图6所示。裁剪 出左上角位图,并按固定比例大小进行缩放,记录此时高度h0=290、宽度 w0=600,左上角位图如图7所示。

步骤2:用最大类间方差算法二值化该灰度图,进行霍夫变换检测 表格线和倾斜角度,定位出表格左上角及角度的矫正。以左下角为坐标 原点,检测到表格左上角坐标为(99,93)、角度为00

步骤3:位图无倾斜,不需要矫正。

步骤4:以(99,93)为矩形左下角,按固定比例从原灰度图中裁剪出目 标所在区域部分,记为image0如图8所示。

步骤5:简单统计法二值化image0,搜索8领域连通域消除孤立噪声 点,并进行边缘清理,记录此时二值位图为I1

步骤6:在I1中用扫描像素的方法定位字符的上下轮廓特征,得到 其间隔的离散值span(1,I1_x),有

span(1,i)=U(1,i)-D(1,i)

其中,I1_x为I1的宽,i初始化为0,上限为I1_x-1,移动步长为1, U(1,I1_x)、D(1,I1_x)分别记录上下轮廓的纵坐标点。

自左向右分析span(1,i)空白间隔处缩小目标所在区域范围,切除开票 日期头的左下角坐标为(80,0),基于灰度位图image0再次切割记为image1, 如图9所示。

步骤7:依据先递减后递增的规律从左向右逐一查找span(1,i)中的极 值点(注:i从80开始),设小于d=7为切分点,其横坐标:29、39、47、 57、64、74、83、94、110(注:i-80后的下标)。基于image1灰度位图裁 剪,最终切分成字符碎片,用otsu算法二值化。

步骤8:对字符碎片做轮廓临界点裁剪,效果参见图10,放大字符 碎片效果见图11。二次切分自适应提取有效字符片位图。首先,统计字 符碎片高度、宽度,排序查找出现次数最多的高度、宽度分别记为ha=13、 wa=8,其次,鉴于此时二值化位图细节清晰,只需取上轮廓特征极值点, 参考ha、wa及非有效字符的提取情况,自适应的进行二次切分,直至取 到所有有效字符片存于数组矩阵digital_matrix中。提取出的8个数字片显 示如图12。

以上实施例中提取的有效字符数量及识别结果判断切分正确,无需 再使用实施例2中的方案进行处理,而对有些发票需要实施例2中的方 案重新切分,即执行实施例2步骤5~步骤7得到切分及提取结果。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号