首页> 中国专利> 一种统计纸质文本字体个数的方法及装置

一种统计纸质文本字体个数的方法及装置

摘要

本发明公开了一种拍照统计纸质文本字数的方法及装置,能够解决不能有效统计纸质文本字体总数的问题。该方法包括:根据接收的字数统计指令,启动拍照功能采集纸质文本的图像信息;根据所述纸质文本的图像信息统计所述纸质文本的总字体个数。通过使用该方法,可以基于电子设备的拍照功能以及结合图像识别处理技术快速有效的实现纸质文本的字数统计,方便了纸质文本书写者或阅读者对纸质文本字数的统计,提升了用户体验。

著录项

  • 公开/公告号CN105354834A

    专利类型发明专利

  • 公开/公告日2016-02-24

    原文格式PDF

  • 申请/专利权人 广东欧珀移动通信有限公司;

    申请/专利号CN201510671163.7

  • 发明设计人 丁泽楠;

    申请日2015-10-15

  • 分类号G06T7/00;G06K9/20;

  • 代理机构北京品源专利代理有限公司;

  • 代理人邓猛烈

  • 地址 523860 广东省东莞市长安镇乌沙海滨路18号

  • 入库时间 2023-12-18 14:21:19

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-04-17

    授权

    授权

  • 2016-03-23

    实质审查的生效 IPC(主分类):G06T7/00 申请日:20151015

    实质审查的生效

  • 2016-02-24

    公开

    公开

说明书

技术领域

本发明实施例涉及图像识别技术领域,尤其涉及一种拍照统计纸质文本字 数的方法及装置。

背景技术

随着数字时代的到来,人们更喜欢通过电子设备进行学习和工作。因此很 多文章、邮件等都以电子稿的形式存在,尽管如此,纸质文本的使用在日常生 活中仍有着不可替代的地位,如入党申请书、志愿书、学生作业等也都还是以 手写稿纸质文本的形式存在。

与电子文本相比,纸质文本不能像电子文本那样基于电子设备轻而易举地 统计整篇文章的字数。尤其对于不带格子的纸质手写文本以及打印出来的电子 文本,如果想统计其文本总字数,只能以数数的方式进行,因此文本字数的统 计过程极其麻烦。目前还没有一种有效的方法可以快速统计纸质文本的字数。

发明内容

本发明的目的是提出一种拍照统计纸质文本字数的方法及装置,以解决不 能快速有效统计纸质文本字体个数的问题。

一方面,本发明实施例提供了一种拍照统计纸质文本字数的方法,包括:

根据接收的字数统计指令,启动拍照功能采集纸质文本的图像信息;

根据所述纸质文本的图像信息统计所述纸质文本的总字体个数。

另一方面,本发明实施例提供了一种拍照统计纸质文本字数的装置,包括:

图像信息采集模块,用于根据接收的字数统计指令,启动拍照功能采集纸 质文本的图像信息;

文本字数统计模块,用于根据所述纸质文本的图像信息统计所述纸质文本 的总字体个数。

本发明实施例中提供的一种拍照统计纸质文本字数的方法及装置,能够解 决不能有效统计纸质文本字体总数的问题。本发明实施例提供的拍照统计纸质 文本字数的方法,首先根据接收的字数统计指令,启动拍照功能采集纸质文本 的图像信息,然后根据纸质文本的图像信息就能统计纸质文本的总字体个数。 通过使用该方法,可以基于电子设备快速有效的实现纸质文本的字数统计,方 便了纸质文本书写者或阅读者对文本字数的统计,提升了用户体验。

附图说明

图1为本发明实施例一提供的一种拍照统计纸质文本字数的方法的流程示 意图;

图2为本发明实施例二提供的一种拍照统计纸质文本字数的方法的流程示 意图;

图3为本发明实施例四提供的一种拍照统计纸质文本字数的装置的结构框 图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。可以 理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限 定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部 分而非全部结构。

实施例一

图1为本发明实施例一提供的一种拍照统计纸质文本字数的方法的流程示 意图,该方法可以由拍照统计纸质文本字数的装置执行,其中该装置可由软件 和/或硬件实现,并一般集成于电子设备中。如图1所示,该方法包括:

步骤101、根据接收的字数统计指令,启动拍照功能采集纸质文本的图像信 息。

在本实施例中,所述字数统计指令具体可指:用于触发手机、平板电脑等 携带摄像头的电子设备启动拍照功能进行纸质文本图像信息采集的指令。所述 字数统计指令可以在进行纸质文本字数统计时通过人为触发安装在电子设备中 的拍照统计纸质文本字数的装置形成。

在本实施例中,当手机或平板电脑等电子设备接收到字数统计指令后,可 以启动所述电子产品自身的拍照功能,基于拍照功能对纸质文本的内容进行拍 照,由此可采集纸质文本的图像信息。需要说明的是,采集的图像信息均保存 在电子设备中,基于这些图像信息可以对相应的纸质文本多次进行字体个数的 统计。

进一步的,根据接收的字数统计指令,启动拍照功能采集所述纸质文本的 图像信息,具体包括:

获取所述纸质文本的总页数信息;

根据接收的字数统计指令启动拍照功能,采集并保存所述纸质文本所有页 的页图像信息。

在本实施例中,所述纸质文本具体可指以汉字为主的文本,常见的纸质文 本有手写稿件或文章、以及打印出的电子稿件或文章等。一般地,所述纸质文 本的总页数至少为1,所以在统计文本字数前,可以先确定纸质文本的总页数信 息,以便纸质文本图像信息的采集。

在本实施例中,在根据字数统计指令启动拍照功能后,可以页为单位对纸 质文本的所有页进行图像信息采集,将每页看作一个页图像信息。具体的,纸 质文本所有页的页图像信息保存在电子设备的存储空间中,然后以缩略图的形 式选中纸质文本所有页的页图像信息,由此开始对纸质文本总字体个数的统计。

步骤102、根据所述纸质文本的图像信息统计所述纸质文本的总字体个数。

在本实施例中,基于所述纸质文本所有页的页图像信息可以统计出纸质文 本的总字体个数。具体的,基于所有页的页图像信息统计纸质文本总字数的过 程可描述为:采集纸质文本所有页的页图像信息后,基于每页的页图像信息识 别每页的页图像信息呈现的主要颜色(一般地,识别出的主要颜色为字体颜色 和纸质颜色);其次,基于在每页的页图像信息中识别出的主要颜色之间的色 差,确定字体在相应页图像信息中的位置,并基于字体位置统计页图像信息中 上下两字体间存在空隙的数量;之后,基于统计的空隙数量确定相应页图像信 息的字体行数、平均字高和平均字宽;然后,基于相应页图像信息的字体行数、 平均字高和平均字宽确定相应页图像信息的页字体个数;最终将所有页的页字 体个数相加求和,计算出的页字体个数之和就是相应纸质文本的总字体个数。

在本实施例中,需要说明的是,采集图像信息时可以依次采集不同纸质文 本的图像信息并保存,之后再依次计算出不同纸质文本的总字体个数,利用纸 质文本的总字体个数还可以对不同纸质文本进行比对,通过对总字体个数的求 差计算,实现不同纸质文本之间篇幅大小的比较,从而方便找出字体个数较多 或较少的纸质文本。

本发明实施例一提供的一种拍照统计纸质文本字数的方法,首先根据接收 的字数统计指令,启动拍照功能采集纸质文本的图像信息,然后根据纸质文本 的图像信息就能统计纸质文本的总字体个数。通过使用该方法,可以基于电子 设备的拍照功能结合图像识别处理技术快速有效的实现纸质文本的字数统计, 方便了纸质文本书写者或阅读者对纸质文本字数的统计,提升了用户体验。

实施例二

图2为本发明实施例二提供的一种拍照统计纸质文本字数的方法的流程示 意图,本实施例以上述实施例为基础进行优化,将步骤“根据所述纸质文本的 图像信息统计所述纸质文本的总字体个数”进一步优化为步骤:根据所述纸质 文本所有页的页图像信息确定每页的页图像信息的页字体个数;计算所有页的 页字体个数之和,将所述页字体个数之和作为所述纸质文本的总字体个数。

同时,又将步骤“根据所述纸质文本所有页的页图像信息确定每页的页图 像信息的页字体个数”进一步具体化。

如图2所示,本发明实施例二提供的一种拍照统计纸质文本字数的方法, 包括如下步骤:

步骤201、获取所述纸质文本的总页数信息。

在本实施例中,纸质文本总页数信息的获取途径不唯一。一般地,可在触 发拍照统计纸质文本字数的装置启动后,使其直接接收字数统计指令,之后在 启动拍照功能进行图像信息采集的过程中,基于电子设备屏幕上弹出的提示框 确定是否继续进行图片信息采集,当对纸质文本的最后一张进行图像采集后可 通过提示框选择结束拍照采集。此外,纸质文本的总页数信息的获取可优选为, 在触发启动拍照统计纸质文本字数的装置后,基于电子设备屏幕上弹出的获取 纸质文本总页数信息的对话框,由用户手动输入纸质文本的总页数信息,进而 在输入完毕后点击“确定”按钮时触发形成之后的字数统计指令,再基于字数 统计指令的触发启动拍照功能。

步骤202、根据接收的字数统计指令启动拍照功能,采集并保存所述纸质文 本所有页的页图像信息。

在本实施例中,在启动拍照功能后,以页为单位对所述纸质文本进行拍照, 由此采集纸质文本所有页的页图像信息并保存至电子设备的存储空间中。

步骤203、根据所述纸质文本所有页的页图像信息识别每页的页图像信息的 字体颜色和纸质颜色,通过所述字体颜色和纸质颜色的色差确定每页的页图像 信息中字体的位置。

在本实施例中,基于采集的纸质文本所有页的页图像信息,可以对每页的 页图像信息进行图像识别,在图像识别过程中主要重点识别页图像信息中的不 同颜色,一般可以识别出页图像信息中的字体颜色(如黑色、蓝色或红色等) 和纸质颜色(如白色或浅黄色等)。

在识别出相应页图像信息中的字体颜色和纸质颜色后,就可基于两种颜色 的色差确定字体在页图像信息中的位置,同时利用图像处理技术还可分析出一 个页图像信息的格局主要为字体颜色的行列排布,且字体颜色间存在纸质颜色 组成的空隙。

步骤204、统计每页的页图像信息中上下两字体间空隙的数量,确定每页的 页图像信息的字体行数以及平均字高和字宽。

在本实施例中,对于每页的页图像信息,在经过图像识别技术处理后可以 确定纸质文本中字体的排布格局。基于行列形式的排布格局可进一步确定每页 的页图像信息具有的行数,同时还可基于识别出的字体颜色,确定页图像信息 中字体的平均字高和平均字宽。

在本实施例中,确定每页的页图像信息字体行数的过程可简要描述为:首 先基于识别出的纸质文本中字体的排布格局,确定上下两行字体颜色间的空隙 为纸质颜色;然后,统计上下两字体颜色间存在的纸质颜色的数量,即统计纸 质文本上下两字体间空隙的数量;最终,基于统计出的空隙数量确定每页的页 图像信息的字体行数。示例性的,对于任一页的页图像信息而言,如果该页页 图像信息统计出的空隙数量为h,则该页页图像信息的字体行数H就为h+1。

同时,基于识别出的字体颜色和纸质颜色还可直接确定页图像信息中每个 字体的宽度以及每行字体的高度,然后对多个字体的字体宽度值进行取样,基 于这些字体的字体宽度值可估算出相应页图像向信息中所有字体的平均字宽; 此外,基于确定出的字体行数和每行字体的字体高度,还可确定出相应页图像 信息中所有字体的平均字高。

步骤205、根据所述字体行数以及平均字高和字宽,统计每页的页图像信息 的每行中左右两字体间空隙的数量M以及每行中标点符号的数量m。

在本实施例中,当确定出每页的页图像信息的字体行数、平均字高和字宽 后,可基于所述字体行数、平均字高和字宽对每行字体的行字体个数进行统计。 需要说明的是,在确定每行的行字体个数前,需要先统计相应页图像信息的每 行中左右两字体间空隙的数量M和标点符号的数量m。

进一步的,所述左右两字体间的空隙为宽度不小于平均字宽四分之一的纸 质颜色;所述标点符号为字高和字宽均不大于平均字高和平均字宽一半的字体。

在本实施例中,统计每行中左右两字体间空隙的数量M的过程可简要描述 为:根据统计出的字体行数,基于纸质颜色对相应页图像信息每行中的左右两 字体间空隙的数量进行统计,其中,每行中左右两字体间的空隙为识别出的纸 质颜色,且所述纸质颜色的宽度不小于平均字宽的四分之一。因此,在相应页 图像信息的任一行中,统计出的左右两字体间纸质颜色的数量即为该行左右两 字体间空隙的数量,且将统计出的空隙的数量记为M。

此外,每行中标点符号的数量m的统计过程可简要描述为:首先,依据定 标点符号的判断规则“如果一个字体的字高和字宽都不大于平均字高和字宽的 一半,则认为是标点符号”判断每个字体是否为标点符号;然后,如果符合标 点符号判断规则可将标点符号的数量m加1,其中初始m的值为0。最终,当 任一行中的字体都判定完后,可确定该行中的标点符号数量为m。

步骤206、根据所述每行中左右两字体间空隙的数量M以及每行中标点符 号的数量m,确定每行的行字体个数N,其中N=M+1-m。

在本实施例中,当统计出每行中左右两字体间空隙的数量M以及每行中标 点符号的数量m后,可计算每行的行字体数N,且N=M+1-m。计算出的行字体 个数可保存在电子设备的缓存中,用于之后页字体个数的计算。

步骤207、计算每页的页图像信息中所有行的行字体个数之和,将所述行字 体个数之和作为相应页的页图像信息的页字体个数。

在本实施例中,在纸质文本的图像信息采集完成后,需要选中纸质文本所 有页的页图像信息的缩略图,从而依次对选中的页图像信息的页字体个数进行 统计。由上述步骤可知,页图像信息的页字体个数就是该页图像信息中所有行 的行字体个数之和。其中,计算出的页图像信息的页字体个数也保存在电子设 备的缓存中,用于之后纸质文本总字体个数的计算。

步骤208、计算所有页的页字体个数之和,将所述页字体个数之和作为所述 纸质文本的总字体个数。

在本实施例中,根据步骤207计算出的页图像信息的页字体个数,可再次 对所有页的页字体个数求和,因此,所要统计纸质文本的总字体个数就是所有 也的页字体个数之和。

此外,在统计出纸质文本的总字体个数后,还可对不同纸质文本的总字体 个数进行比对。比对过程主要是:选中两个不同纸质文本的总字体个数,对其 进行求差运算,由此确定字数较多的纸质文本。进一步的,对不同纸质文本的 总字体个数进行两两求差,可用于找出总字体个数较多或较少的纸质文本。

本发明实施例二提供的一种拍照统计纸质文本字数的方法,首先根据接收 的字数统计指令,启动拍照功能采集纸质文本所有页的页图像信息,然后根据 纸质文本所有页的页图像信息就能统计出每页的页图像信息的页字体个数,最 后对所有页的页字体个数进行求和计算就能统计出纸质文本的总字体个数。通 过使用该方法,可以基于电子设备的拍照功能结合图像识别处理技术快速有效 的实现纸质文本的字数统计,方便了纸质文本书写者或阅读者对纸质文本字数 的统计,进一步提升了用户体验。

实施例三

图3为本发明实施例四提供的一种拍照统计纸质文本字数的装置的结构框 图,该装置可由软件和/或硬件实现,可作为电子设备的一部分被内置在电子设 备中。如图3所示,该装置具体包括:图像信息采集模块301和文本字数统计 模块302。

图像信息采集模块301,用于根据接收的字数统计指令,启动拍照功能采集 纸质文本的图像信息。

文本字数统计模块302,用于根据所述纸质文本的图像信息统计所述纸质文 本的总字体个数。

本发明实施例三提供的一种拍照统计纸质文本字数的装置,在图像信息采 集模块301接收到字数统计指令后,启动拍照功能采集纸质文本的图像信息; 然后在文本字数统计模块302根据纸质文本的图像信息实现纸质文本总字体个 数的统计。利用该装置,可通过电子设备的拍照功能结合图像识别处理技术快 速有效的实现纸质文本的字数统计,方便了纸质文本书写者或阅读者对纸质文 本字数的统计,由此提升了用户体验。

在上述实施例的基础上,所述图像信息采集模块301,具体用于:获取所述 纸质文本的总页数信息;根据接收的字数统计指令启动拍照功能,采集并保存 所述纸质文本所有页的页图像信息。

在上述实施例的基础上,所述文本字数统计模块302,包括:页字体个数确 定单元,用于根据所述纸质文本所有页的页图像信息确定每页的页图像信息的 页字体个数;总字体个数确定单元,用于计算所有页的页字体个数之和,将所 述页字体个数之和作为所述纸质文本的总字体个数。

进一步的,所述页字体个数确定单元,具体用于:根据所述纸质文本所有 页的页图像信息识别每页的页图像信息的字体颜色和纸质颜色,通过所述字体 颜色和纸质颜色的色差确定每页的页图像信息中字体的位置;统计每页的页图 像信息中上下两字体间空隙的数量,确定每页的页图像信息的字体行数以及平 均字高和字宽;根据所述每页字体行数以及平均字高和字宽,统计每页的页图 像信息的每行中左右两字体间空隙的数量M以及每行中标点符号的数量m;根 据所述每行中左右两字体间空隙的数量M以及每行中标点符号的数量m,确定 每行的行字体个数N,其中N=M+1-m;计算每页的页图像信息中所有行的行字 体个数之和,将所述行字体个数之和作为相应页的页图像信息的页字体个数。

在上述实施例的基础上,所述左右两字体间的空隙为宽度不小于平均字宽 四分之一的纸质颜色;所述标点符号为字高和字宽均不大于平均字高和字宽一 半的字体。

需要说明的是,基于本发明所提的拍照统计纸质文本字数的装置,采集图 像信息时可以依次采集不同纸质文本的图像信息并保存,之后再依次计算出不 同纸质文本的总字体个数,利用纸质文本的总字体个数还可以对不同纸质文本 进行比对,通过对总字体个数的求差计算,实现不同纸质文本之间篇幅大小的 比较,从而方便找出字体个数较多或较少的纸质文本。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员 会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进 行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽 然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以 上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例, 而本发明的范围由所附的权利要求范围决定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号