首页> 中国专利> 字体识别装置、字体识别方法及信息记录媒体

字体识别装置、字体识别方法及信息记录媒体

摘要

本发明涉及字体识别装置、字体识别方法及信息记录媒体,字体识别部4包括扫描宽度频率图处理部11、特征量计算部12及识别部13,处理部11对文字图像制作垂直方向和水平方向的扫描宽度频率图,再分别求得各自的平均扫描宽度,特征量计算部12计算上述垂直方向与水平方向的平均扫描宽度之比作为特征量,识别部13根据该特征量识别字体。即使是包含斜笔划和噪音信号的文字图像也能容易且正确地识别该文字字体。

著录项

  • 公开/公告号CN1188944A

    专利类型发明专利

  • 公开/公告日1998-07-29

    原文格式PDF

  • 申请/专利权人 株式会社理光;

    申请/专利号CN97126259.4

  • 发明设计人 阿部悌;

    申请日1997-12-24

  • 分类号G06K9/20;G06K9/62;

  • 代理机构中国专利代理(香港)有限公司;

  • 代理人叶恺东

  • 地址 日本东京都

  • 入库时间 2023-12-17 13:13:05

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-02-11

    未缴年费专利权终止 IPC(主分类):G06K9/20 授权公告日:20030409 终止日期:20131224 申请日:19971224

    专利权的终止

  • 2003-04-09

    授权

    授权

  • 1999-08-18

    实质审查请求的生效

    实质审查请求的生效

  • 1998-07-29

    公开

    公开

说明书

本发明涉及进行文字字体(font)识别的字体识别装置、字体识别方法及信息记录媒体。

以往,在例如特开平6-208649号中公开了一种字体识别技术,推定文字纵向及横向的文字线宽,根据它们的线宽比,识别文字字体是明朝体还是黑体(均为日文字体名称)。更具体地说,该字体识别技术是由文字图像的水平方向和垂直方向的扫描宽度频率图(ランレンゲスヒストゲラム)的最频值,推定横向及纵向的文字线宽,根据它们的线宽此,识别文字字体是明朝体还是黑体的。

但是,在上述以往的字体识别技术中,存在只有当象“中”、“田”那样构成文字的笔划大多是水平或垂直的直线、且图像没有躁音信号场合才能进行良好识别的问题。即,由于大部分文字存在斜笔划,当文字中存在斜笔划时,在上述以往的字体识别技术中,根据上述扫描宽度频率图的最频值,往往不能检测出正确的线宽。另外,未必能说明朝体的横笔划比黑体的细。因此,上述以往的字体识别技术存在不能正确识别大多数文字的字体、不适合实用化的问题。

本发明就是鉴于上述先有技术所存在的问题而提出来的,本发明的目的在于,提供一种即使对于包含斜笔划即躁音信号的文字图像、也能很容易且正确地识别该文字字体的字体识别装置、字体识别方法及信息记录媒体。

另外,本发明的目的还在于,提供一种即使是粗写的明朝体文字图像、细写的黑体的文字图像也能正确识别该字体的字体识别装置、字体识别方法及信息记录媒体。

为了实现上述目的,本发明提出一种字体识别装置,其特征在于:包括扫描宽度频率图处理装置及识别装置,上述扫描宽度频率图处理装置对文字图像制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,从上述垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从上述水平方向的扫描宽度频率图求得水平方向的平均扫描宽度;上述识别装置计算由扫描宽度频率图处理装置所得的垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量,根据该特征量,识别文字的字体。

根据本发明的字体识别装置,其特征还在于,上述扫描宽度频率图处理装置将制作扫描宽度频率图时的扫描宽度(ランレンゲス)限定在比预先决定的阈值小的范围,制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,求取垂直方向的平均扫描宽度和水平方向的平均扫描宽度。

根据本发明的字体识别装置,其特征还在于,上述扫描宽度频率图处理装置将制作扫描宽度频率图时的扫描宽度限定在比与文字的尺寸成比例而决定的阈值小的范围,制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,求取垂直方向的平均扫描宽度和水平方向的平均扫描宽度。

根据本发明的字体识别装置,其特征还在于,上述扫描宽度频率图处理装置对于从文字图像在水平方向仅仅提取比预先决定的阈值长的扫描线(ラン)的图像求得垂直方向的扫描宽度频率图,对于从文字图像在垂直方向仅仅提取比预先决定的阈值长的扫描线的图像求得水平方向的扫描宽度频率图,从垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从水平方向的扫描宽度频率图求得水平方向的平均扫描宽度。

根据本发明的字体识别装置,其特征还在于,上述扫描宽度频率图处理装置对于从文字图像在水平方向仅仅提取比与文字的尺寸成比例而决定的阈值长的扫描线的图像求得垂直方向的扫描宽度频率图,对于从文字图像在垂直方向仅仅提取比与文字的尺寸成比例而决定的阈值长的扫描线的图像求得水平方向的扫描宽度频率图,从垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从水平方向的扫描宽度频率图求得水平方向的平均扫描宽度。

本发明还提出一种字体识别方法,其特征在于,对文字图像制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,从上述垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从上述水平方向的扫描宽度频率图求得水平方向的平均扫描宽度,计算垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量,根据该特征量,识别文字的字体。

本发明还提出一种信息记录媒体,其特征在于,记录下列程序:对文字图像制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,从上述垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从上述水平方向的扫描宽度频率图求得水平方向的平均扫描宽度,计算垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量,根据该特征量,识别文字的字体。

下面说明本发明的效果,根据如上所述,本发明的装置包括扫描宽度频率图处理装置及识别装置,上述扫描宽度频率图处理装置对文字图像制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,从上述垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度,从上述水平方向的扫描宽度频率图求得水平方向的平均扫描宽度;上述识别装置计算由扫描宽度频率图处理装置所得的垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量,根据该特征量,识别文字的字体因此,能容易、正确、精度良好地识别文字图像的文字字体。

附图简要说明如下:

图1是表示本发明涉及的字体识别装置的构成例的图;

图2是表示一个文字图像例的图;

图3是表示图1的字体识别部的构成例的图;

图4是用于说明图1、图3的字体识别装置的处理动作例的流程图;

图5是表示图1、图3的字体识别装置的处理的具体例的图;

图6是表示图1、图3的字体识别装置的处理的具体例的图;

图7是表示图1的字体识别部的另一个构成例的图;

图8是用于说明图1、图7的字体识别装置的处理动作例的流程图;

图9是表示图1、图7的字体识别装置的处理的具体例的图;

图10是表示图1、图7的字体识别装置的处理的具体例的图;

图11是表示图1的字体识别装置的硬件构成例的图。

下面,参照附图说明本发明的实施例,图1是表示本发明涉及的字体识别装置的构成例的图,如图1所示,该字体识别装置包括将文书作为例如双值图像读入的图像输入部1、存储由图像输入部1读入的文书图像等的存储器2、从文书图像分离出文字图像的文字截取处理部3、对由文字截取处理部3截取的文字图像进行该文字的字体识别的字体识别部4、对整体进行控制的控制部5以及输出由字体识别部4得出的文字字体的识别结果的结果输出部6。

这里,文字截取处理部3是从文书图像截取例如象图2所示一个文字图像,即,在图2例中,一个文字图像“永”用文字的外接矩形区域AR被截取出来。

图3表示图1的字体识别部4的构成例,在图3例中,字体识别部4包括扫描宽度频率图处理部11、特征量计算部12及识别部13,扫描宽度频率图处理部11对文字图像制作垂直方向的扫描宽度频率图和水平方向的扫描宽度频率图,从垂直方向的扫描宽度频率图求垂直方向的平均扫描宽度,从水平方向的扫描宽度频率图求水平方向的平均扫描宽度;特征量计算部12计算由扫描宽度频率图处理部11得出的垂直方向的平均扫描宽度与水平方向平均扫描宽度之比作为特征量;识别部13根据特征量计算部12算出的特征量识别文字字体。

更具体地说,识别部13将垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比与所定阈值比较,判别字体。

下面参照图4流程图说明这种构成的字体识别装置(图1、图3的字体识别装置)的处理动作例。

在步骤S101中,通过图像输入部1读入作为字体识别对象的记载有文字的文书(例如原稿),将其作为文书图像存入存储器2内。随后,在步骤S102中,通过文字截取处理部3从文书图像仅仅截取出文字图像进行求其外接矩形区域座标的文字矩形截取处理。这样,对包含在文书图像中的各文字图像进行截取,对截出的各文字图像进行字体的识别处理。

在步骤S103中,对各文字图像之中一个文字图像制作文字矩形内的图像的垂直方向的扫描宽度频率图,从该垂直方向的扫描宽度频率图求得垂直方向的平均扫描宽度。在步骤S104中,制作文字矩形内的图像的水平方向扫描宽度频率图,从该水平方向的扫描宽度频率图求得水平方向的平均扫描宽度。

接着,在步骤S105中,求得步骤S103中所得的垂直方向的平均扫描宽度与步骤S104中所得的水平方向的平均扫描宽度之比,即垂直方向的平均扫描宽度/水平方向的平均扫描宽度。

然后,在步骤S106中,判断在步骤S105中求得的平均扫描宽度之比是否比所定阈值(例如0.7)大,若比所定阈值大,就进入步骤S107,判定该文字字体是黑体。若在步骤S106判断平均扫描宽度之比比所定阈值小时,就进入步骤S108,判定该文字字体是明朝体。

这样,对包含在文书图像中的各文字图像之一进行字体识别之后,在步骤S109中,判定是否有其它文字矩形,若有其它文字矩形,就回到步骤S103,对后面的文字进行同样处理,识别其字体。

对包含在文书图像中的各文字顺序进行识别其字体的处理,若在步骤S109判定不存在其它文字矩形时(全部文字字体识别处理结束时),则处理全部结束。

图5、图6表示图1、图3的字体识别装置的处理具体例,文字图像是例如图5a那样的明朝体文字“永”时,扫描宽度频率图处理部11制作的垂直方向的扫描宽度频率图与水平方向的扫描宽度频率图如图5b所示。图5a的文字图象场合,由图5b可知,水平方向的平均扫描宽度A1比垂直方向的平均扫描宽度A2大,因此,如图5c所示,垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比小,由于该比值小,能识别图5a的文字图像是明朝体。

当文字图像是例如图6a那样的黑体文字“永”时,扫描宽度频率图处理部11制作的垂直方向的扫描宽度频率图与水平方向的扫描宽度频率图如图6b所示。图6a的文字图像场合,由图6b可知,水平方向的平均扫描宽度A1与垂直方向的平均扫描宽度A2之差几乎没有,因此,如图6c所示,垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比大,由于该比值大,能识别图6a的文字图像是黑体。

这样,在该字体识别装置中,由垂直方向的扫描宽度频率图求垂直方向的平均扫描宽度,由水平方向的扫描宽度频率图求水平方向的平均扫描宽度,将垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量,识别文字字体,能以非常高的精度高效地识别文字。即,在以往的字体识别方式中,是根据文字图像的水平方向和垂直方向的扫描宽度频率图的最频值,推定横向及纵向的文字线宽,由上述线宽之比识别文字字体是明朝体还是黑体,如前所述,以往这种方法不能正确识别文字字体是明朝体还是黑体。与此相反,在本发明的字体识别方式中,能正确识别文字的字体。

另外,上述方法是将垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量的,虽然也可以考虑将垂直方向的平均扫描宽度和水平方向的平均扫描宽度本身作为特征量来取代上述特征量,但是,这时,当识别对象文字是粗的明朝体和细的黑体场合,恐怕会引起误识别。

与此相反,按照明朝体中纵笔划比横笔划粗、黑体中纵笔划与横笔划的粗细差别几乎没有这样的状况,如本发明那样,使用垂直方向的平均扫描宽度和水平方向的平均扫描宽度之比时,当识别对象文字是粗的明朝体和细的黑体场合,也能精度良好地识别文字字体是明朝体还是黑体。

在本发明的字体识别装置中,扫描宽度频率图处理部11在制作扫描宽度频率图时,也可以将扫描宽度限定在比预先决定的所定阈值小的范围制作垂直方向和水平方向的扫描宽度频率图。这种场合,在垂直方向的扫描宽度频率图上能正确地得出水平笔划的粗细,在水平方向的扫描宽度频率图上能正确地得出垂直笔划的粗细。

就是说,若以例如纵向的扫描宽度频率图为例,制作纵向的扫描宽度频率图后求其平均是以得出横笔划粗细为目的,例如文字“一”的场合,可制作全部的扫描宽度频率图,可是这样的文字与其说是理想文字不如说是特例。与此相反,通常文字中制作纵向的扫描宽度频率图时,横笔划以外的部分还有不少(大部分场合比横笔划粗),这样取平均的话,得出的值比横笔划的粗细要大。因此,限定在比所定阈值小的范围制作扫描宽度频率图,能够得出本来想提取的横笔划的粗细,这里例如设定比预料的横笔划粗细的最大值还稍大的值作为所定的阈值。

横向扫描宽度频率图也同样,限定在比所定阈值(例如设定比预料的纵笔划粗细的最大值还稍大的值作为该阈值)小的范围制作扫描宽度频率图,能得出本来想提取的纵笔划的粗细。

因此,根据这样制作的垂直方向和水平方向的扫描宽度频率图,将垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量识别文字字体时,能精度非常好地识别文字字体。

另外,在本发明的字体识别装置中,当扫描宽度频率图处理部11制作扫描宽度频率图时,也可以采用与文字尺寸大小成比例决定的阈值作为上述所定的阈值,限定在比上述阈值小的范围制作垂直方向和水平方向的扫描宽度频率图。

这里,如图2所示,文字截取处理部3从文书图像以文字的外接矩形区域AR截取文字图像时,文字的尺寸大小可以检测该外接矩形区域AR的大小(例如高度)。

这样,当将扫描宽度限定在比与文字大小成比例决定的阈值小的范围制作垂直方向和水平方向的扫描宽度频率图时,在垂直方向的扫描宽度频率图中能正确地提取水平笔划的粗细,在水平方向的扫描宽度频率图中能正确地提取垂直笔划的粗细。因此,根据这样制作的垂直方向和水平方向的扫描宽度频率图,将垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比作为特征量识别文字的字体时,能精度非常好地识别文字字体。

图7表示图1的字体识别部4的另一个构成例,在字体识别部4中还设有提取比所定阈值长的扫描线的扫描线提取部15。即,在图7构成例中,扫描线提取部15从文字图像在水平方向仅仅提取比预先决定的阈值长的水平方向扫描线,在垂直方向仅仅提取比预先决定的阈值长的垂直方向扫描线,扫描宽度频率图处理部11对于从文字图像在水平方向仅仅提取比预先决定的阈值长的水平方向扫描线的图像求得垂直方向的扫描宽度频率图,对于从文字图像在垂直方向仅仅提取比预先决定的阈值长的垂直方向扫描线的图像求得水平方向的扫描宽度频率图。

图8是表示字体识别部4如图7那样构成的字体识别装置的处理动作例的流程图。

请参照图8,在步骤S201,通过图像输入部1读入作为字体识别对象的记载有文字的文书(例如原稿),将其作为文书图像存入存储器2内。随后,在步骤S202中,通过文字截取处理部3从文书图像仅仅截取出文字图像,进行求其外接矩形区域座标的文字矩形截取处理。这样,对包含在文书图像中的各文字图像进行截取,对截出的各文字图像进行字体的识别处理。

在步骤S203中,对各文字图像之中一个文字图像、也就是文字矩形内的图像,在水平方向提取扫描线,这时形成提取了比所定阈值长的水平方向扫描线的图像。在步骤S204中,对于提取了比所定阈值长的水平方向扫描线的图像制作垂直方向的扫描宽度频率图,从垂直方向的扫描宽度频率图求取垂直方向的平均扫描宽度。在步骤S205中,对各文字图像之中一个文字图像、也就是文字矩形内的图像,在垂直方向提取扫描线,这时,形成提取了比所定阈值长的垂直方向扫描线的图像。在步骤S206中,对于提取了比所定阈值长的垂直方向扫描线的图像制作水平方向的扫描宽度频率图,从水平方向的扫描宽度频率图求取水平方向的平均扫描宽度。

接着,在步骤S207中,求取步骤S204中所得的垂直方向的平均扫描宽度与步骤S206中所得的水平方向的平均扫描宽度之比。

然后,在步骤S208中,判断在步骤S207中求得的平均扫描宽度之比是否比所定阈值(例如0.7)大,若比所定阈值大,就进入步骤S209,判定该文字字体是黑体。若在步骤S208中判断平均扫描宽度之比比所定阈值小时,就进入步骤S210,判定该文字字体是明朝体。

这样,对包含在文书图像中的各文字图像之一进行字体识别之后,在步骤S211中,判定是否有其它文字矩形,若有其它文字矩形,就回到步骤S203,对后面的文字进行同样的处理,识别其字体。

对包含在文书图像中的各文字顺序进行识别其字体的处理,若在步骤S211判定不存在其它文字矩形时(全部文字字体识别处理结束时),则处理全部结束。

图9、图10表示这种构成的字体识别装置的处理具体例,文字图像是例如图9a那样的明朝体的文字“永”时,由扫描线提取部15提取的水平方向、垂直方向的扫描线图像如图9b所示,对于图9b的水平方向、垂直方向的扫描线图像,由扫描宽度频率图处理部11分别制作的垂直方向及水平方向的扫描宽度频率图如图9c所示。图9a所示文字图像场合,从图9c可知,水平方向的平均扫描宽度A1比垂直方向的平均扫描宽度A2大,因此,如图9d所示,垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比小,由于该比值小,能识别图9a文字图像是明朝体。

文字图像是例如图10a那样的黑体的文字“永”时,由扫描线提取部15提取的水平方向、垂直方向的扫描线图像如图10b所示,对于图10b的水平方向、垂直方向的扫描线图像,由扫描宽度频率图处理部11分别制作的垂直方向及水平方向的扫描宽度频率图如图10c所示。图10a所示文字图像场合,从图10c可知,水平方向的平均扫描宽度A1与垂直方向的平均扫描宽度A2的差几乎没有,因此,如图10d所示,垂直方向的平均扫描宽度与水平方向的平均扫描宽度之比大,由于该比值大,能识别图10a文字图像是黑体。

这样,使用图7的构成例作为图1的字体识别部4时,抽出比所定阈值长的扫描线,对于该抽出图像进行字体识别处理,识别字体时,能显著地减少包含在原来图像中的躁音信号等的影响,高精度识别字体成为可能。另外,抽出比所定阈值长的扫描线(水平方向扫描线,垂直方向扫描线)成为仅抽出水平笔划、垂直笔划的粗细,斜笔划影响非常少,因此能精度良好地识别字体。

在上述说明中,图1的字体识别部为图7的构成例时,扫描线抽出部15从文字图像中在水平方向仅仅抽出比预先决定的阈值长的水平方向扫描线,在垂直方向仅仅抽出比预先决定的阈值长的垂直方向扫描线,但是,扫描线抽出部15也可以从文字图像中在水平方向仅仅抽出比与文字尺寸大小成比例而决定的阈值长的水平方向扫描线,在垂直方向仅仅抽出比与文字尺寸大小成比例而决定的阈值长的垂直方向扫描线。这时,扫描宽度频率图处理部11对于从文字图像中在水平方向仅仅抽出比与文字尺寸大小成比例而决定的阈值长的水平方向扫描线图像制作垂直方向的扫描宽度频率图,对于在垂直方向仅仅抽出比与文字尺寸大小成比例而决定的阈值长的垂直方向扫描线图像制作水平方向的扫描宽度频率图。

这种场合也是分别仅仅抽出水平笔划、垂直笔划的粗细,斜笔划影响非常小,而且,最初抽出长扫描线时,采用与文字的尺寸大小成比例决定阈值的方法,即使文字尺寸大小变动也能稳定地抽出扫描线,能精度非常好地识别字体。

在上述例中,作为字体以明朝体、黑体为例作了说明,但是,本发明当然也可识别除了明朝体、黑体以外的其它字体。

这样,在本发明中能精度良好地识别文字图像的文字字体,根据所得的文字字体的识别结果,对于例如再现文书图像将是有用的。

图11表示图1的字体识别装置的硬件构成例,该字体识别装置由例如个人计算机等实现,其包括:控制整体的CPU21,存储CPU21的控制程序等的ROM22,作为CPU21的工作区等使用的RAM23,读入文书作为文书图像的扫描器24,将由扫描器24读入的文书图像以例如页单位存储的文书图像外存储器25,输出对包含在文书图像中的各文字图像进行字体识别的结果情报的结果输出装置(例如显示器、打印机)26。

这里,扫描器24、文书图像外存储器25、结果输出装置26分别与图1的图像输入部1、存储器2、结果输出部6对应。另外,CPU21具有图1的控制部5、文字截取处理部3及字体识别部4的功能。

CPU21中作为控制部5、文字截取处理部3、字体识别部4等的功能可以用例如软件包(具体地说,CD-ROM等的信息记录媒体)的形式提供,因此,在图11的例中,设有信息记录媒体30时,设置驱动其的媒体驱动装置31。

换句话说,本发明的字体识别装置也可以通过在设有图像扫描器、显示器等通用计算机系统中读入记录在CD-ROM等的信息记录媒体上的程序,由该通用计算机系统的微处理器实行字体识别处理。这时,用于实现本发明的字体识别处理的程序(即硬件系统中使用的程序)以记录在媒体上的状态提供。作为记录程序等的信息记录媒体并不限于CD-ROM,也可以使用ROM、RAM、软磁盘、存储卡等。记录在媒体上的程序通过设置在硬件系统中的存储装置例如硬盘装置被实行,可实现本发明的字体识别处理的功能。

另外,用于实现本发明的字体识别处理的程序不仅能以媒体的形式提供,也可以通过通信(例如共用存储装置)提供。

这样,本发明的字体识别处理可通过程序实现,这时,在本发明的字体识别处理中,能以小程序,高速且高精度地识别字体。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号