首页> 中国专利> 电子文件生成装置及其控制方法、电子文件生成系统

电子文件生成装置及其控制方法、电子文件生成系统

摘要

本发明涉及电子文件生成装置及其控制方法、电子文件生成系统。电子文件生成装置与云服务器合作来生成电子文件,该云服务器生成在针对OCR处理的处理对象图像内的各单位识别区域(能分别包含比一行大的区域的区域)的文字识别结果的末尾分别附加了分割码的OCR处理结果。电子文件生成装置以扫描图像内的各行区域分别被云服务器判定为单位识别区域的方式,实施图像加工处理(例如将各行区域的相互间的分离间隔分别设定为最大高度H1以上的大小的处理)来生成识别对象图像。电子文件生成装置将识别对象图像发送给云服务器,基于来自云服务器的OCR处理结果内的分割码将针对各行区域的文字识别结果分别配置在该各行区域来生成电子文件。

著录项

  • 公开/公告号CN105407245A

    专利类型发明专利

  • 公开/公告日2016-03-16

    原文格式PDF

  • 申请/专利权人 柯尼卡美能达株式会社;

    申请/专利号CN201510562906.7

  • 发明设计人 中村哲平;

    申请日2015-09-07

  • 分类号H04N1/00;G06K9/00;G06K9/34;

  • 代理机构北京集佳知识产权代理有限公司;

  • 代理人李洋

  • 地址 日本东京都

  • 入库时间 2023-12-18 14:59:01

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-05-15

    授权

    授权

  • 2016-04-13

    实质审查的生效 IPC(主分类):H04N1/00 申请日:20150907

    实质审查的生效

  • 2016-03-16

    公开

    公开

说明书

技术领域

本发明涉及生成电子文件的电子文件生成装置以及与该电子文件 生成装置相关的技术。

背景技术

在MFP(多功能数码复合一体机(Multi-FunctionalPeripheral)) 等图像形成装置中,存在一种对原稿进行扫描来生成电子文件的技术。

在这样的技术中,除了原样获取原稿的扫描图像来生成电子文件的 技术之外,还存在生成带文本数据的电子文件(下述)的技术(参照专 利文献1等)。具体而言,针对原稿的扫描图像(特别是表示文字的图 像)实施光学文字识别处理(以下,也称为OCR(OpticalCharacter Recognition)处理),该扫描图像内的文字的文本数据被自动识别,该 文本数据以非显示状态被叠加嵌入到该扫描图像。这样一来,例如可生 成带透明文本的被称为PDF(PortableDocumentFormat)(或者带即 时搜索功能的PDF)文件等的规定形式的电子文件(带文本数据的电子 文件)。

另外,还存在一种使用云服务器来提供通用的OCR处理服务的技术。

专利文献1:日本特开2012-73749号公报

可以考虑使用上述技术来进行以下那样的动作。例如,从电子文件 生成装置向云服务器发送扫描图像,由云服务器执行与扫描图像整体相 关的OCR处理。然后,其处理结果(文本数据)从云服务器回信给电子 文件生成装置,电子文件生成装置将从云服务器接收到的文本数据嵌入 到原来的扫描图像而生成带文本数据的电子文件(带即时搜索功能的 PDF(带透明文本的PDF)文件等)。其中,由于通过利用通用OCR处理 服务,能够由与电子文件生成装置独立的装置进行OCR处理,所以可降 低该电子文件生成装置的处理负荷。

这里,在通用OCR处理服务之中,存在将扫描图像内的文字区域以 规定单位的区域(可包含比一行的行区域大的区域的区域)(例如段落 区域)划分并执行OCR处理,作为OCR处理结果而生成在该规定单位的 区域内的字符串的末尾带有分割码(换行码等)的文本数据的通用OCR 处理服务。电子文件生成装置若从云服务器接收到文本数据,则基于文 本数据内的分割码将该文本数据内的字符串划分为多个并将各字符串 分别配置到扫描图像内的该规定单位的区域(段落区域等),生成电子 文件。

然而,在这样的通用OCR处理服务中,通常包含多行的字符串的区 域被识别为一个段落区域等,生成仅对该多行的字符串整体中的末尾赋 予了分割码的文本数据。换言之,构成段落的多行中的各行(除了段落 的最终行之外)的文字识别结果的末尾未被赋予分割码,以针对该多行 的字符串的文字识别结果(OCR处理结果)的每一个连续的状态输出文 本数据。因此,电子文件生成装置无法掌握扫描图像内的各行的文字图 像与各行的文字识别结果的对应关系,结果,存在该各行的文字识别结 果未被配置到扫描图像内的适当的位置(与各行的文字识别结果对应的 各行的文字图像的位置)的可能性。例如,若以第一行的文字识别结果 与第2行的文字识别结果连续的状态输出文本数据,则该第2行的文字 识别结果在扫描图像内的第一行的文字图像的行末附近,以紧接着第一 行的文字识别结果的状态(未被换行地)配置,未被配置到本来的位置 (扫描图像内的第2行的文字图像的位置)。

发明内容

鉴于此,本发明的课题在于,提供一种能够生成在扫描图像内的适 当的位置配置了OCR处理结果的电子文件的技术。

为了解决上述技术问题,第1方面的发明涉及的电子文件生成装置 与云服务器合作来生成电子文件,所述云服务器将光学文字识别处理的 处理对象图像内的文字区域划分为能分别包含比一行的行区域大的区 域的多个单位识别区域,并且针对所述多个单位识别区域的每一个执行 所述光学文字识别处理,而且,所述云服务器生成包括针对所述多个单 位识别区域的每一个的文字识别结果并且在针对各单位识别区域的文 字识别结果的末尾分别附加了分割码的文本数据来作为针对所述处理 对象图像的所述光学文字识别处理的处理结果,该电子文件生成装置的 特征在于,具备:提取单元,其从原稿的扫描图像的文字区域分别提取 多个行区域;图像生成单元,其以所述多个行区域的每一个被所述云服 务器判定为单位识别区域的方式,针对所述扫描图像实施图像加工处理 来生成识别对象图像;发送单元,其将所述识别对象图像作为所述光学 文字识别处理的所述处理对象图像发送给所述云服务器;接收单元,其 从所述云服务器接收作为针对所述识别对象图像的所述光学文字识别 处理的处理结果的所述文本数据;以及文件生成单元,其基于所述文本 数据所含的所述分割码来将所述文本数据划分为多个字符串数据并且 决定所述多个行区域与所述多个字符串数据的对应关系,在与各字符串 数据对应的各行区域分别配置该各字符串数据来生成所述电子文件。

第2方面的发明基于第1方面的发明涉及的电子文件生成装置而提 出,其特征在于,还具备对所述多个行区域的在所述扫描图像内的位置 分别进行检测的检测单元,所述文件生成单元在与所述各字符串数据对 应的所述各行区域的检测位置分别配置所述各字符串数据来生成所述 电子文件。

第3方面的发明基于第1方面或者第2方面的发明涉及的电子文件 生成装置而提出,其特征在于,所述图像加工处理包括:检测所述多个 行区域各自的高度,并将所述多个行区域的相互间的分离间隔分别设定 为所述多个行区域中最高的行区域的高度以上的大小的处理。

第4方面的发明基于第1方面或者第2方面的发明涉及的电子文件 生成装置而提出,其特征在于,所述图像加工处理包括:检测所述多个 行区域各自的高度,并将所述多个行区域中最终行以外的各行区域与该 各行区域各自的下一行区域的相互间的分离间隔,分别设定为所述各行 区域各自的高度以上的大小的处理。

第5方面的发明基于第1方面或者第2方面的发明涉及的电子文件 生成装置而提出,其特征在于,所述图像加工处理包括:对所述多个行 区域的相互间的行间区域分别附加分割线的处理。

第6方面的发明基于第1方面或者第2方面的发明涉及的电子文件 生成装置而提出,其特征在于,所述图像加工处理包括:在所述多个行 区域中至少最终行以外的各行区域各自的末尾附加表示是所述单位识 别区域的末尾的末尾识别图像的处理。

第7方面的发明基于第1方面或者第2方面的发明涉及的电子文件 生成装置而提出,其特征在于,所述图像加工处理包括:将各行区域的 文字颜色设定为与和所述各行区域分别邻接的邻接行区域的文字颜色 不同的文字颜色的处理。

第8方面的发明基于第1方面或者第2方面的发明涉及的电子文件 生成装置而提出,其特征在于,所述图像加工处理包括:将各行区域的 行头位置设定在与和所述各行区域分别邻接的邻接行区域的行头位置 不同的位置的处理。

第9方面的发明基于第1方面或者第2方面的发明涉及的电子文件 生成装置而提出,其特征在于,所述图像加工处理包括:将各行区域的 文字尺寸设定为与和所述各行区域分别邻接的邻接行区域的文字尺寸 不同的文字尺寸的处理。

第10方面的发明基于第1方面或者第2方面的发明涉及的电子文 件生成装置而提出,其特征在于,所述发送单元在所述识别对象图像的 生成之前向所述云服务器查询由所述云服务器在所述单位识别区域的 判定中使用的判定手法,所述接收单元从所述云服务器接收与所述判定 手法相关的信息,所述图像生成单元针对所述扫描图像实施与所述判定 手法对应的图像加工处理来生成所述识别对象图像。

第11方面的发明基于第1方面或者第2方面的发明涉及的电子文 件生成装置而提出,其特征在于,所述图像生成单元生成相互不同的多 个测试图像,所述多个测试图像被分别实施了相互不同的多个图像加工 处理且分别包含所述多个行区域中的一部分的行区域,所述发送单元将 所述多个测试图像发送给所述云服务器,所述接收单元从所述云服务器 接收作为针对所述多个测试图像分别执行的所述光学文字识别处理的 处理结果的多个测试结果,所述图像生成单元基于所述多个测试结果的 每一个所含的分割码,来检测所述多个测试结果的每一个所含的字符串 数据的个数即字符串数据数,所述图像生成单元针对所述多个测试结果 的每一个求出其字符串数据数与所述一部分的行区域的个数之差即个 数差,并且求出所述多个测试结果中所述个数差最小的测试结果作为最 佳测试结果,将所述多个图像加工处理中与所述最佳测试结果对应的图 像加工处理决定为最适加工处理,所述图像生成单元关于所述多个行区 域中除了所述一部分的行区域之外的剩余的行区域,实施所述最适加工 处理来生成所述识别对象图像,所述文件生成单元基于所述最佳测试结 果所含的分割码和所述文本数据所含的分割码,来将由所述最佳测试结 果和所述文本数据构成的数据划分为多个字符串数据,并且决定所述多 个行区域与所述多个字符串数据的对应关系,在与各字符串数据对应的 各行区域分别配置该各字符串数据来生成所述电子文件。

第12方面的发明基于第1方面或者第2方面的发明涉及的电子文 件生成装置而提出,其特征在于,所述发送单元将针对样本图像分别实 施相互不同的多个图像加工处理而生成的多个测试图像发送给所述云 服务器,所述接收单元从所述云服务器接收作为针对所述多个测试图像 分别执行的所述光学文字识别处理的处理结果的多个测试结果,所述图 像生成单元基于所述多个测试结果的每一个所含的分割码,来检测所述 多个测试结果的每一个所含的字符串数据的个数即字符串数据数,所述 图像生成单元针对所述多个测试结果的每一个求出其字符串数据数与 所述样本图像所含的行区域的个数之差即个数差,并且求出所述多个测 试结果中所述个数差最小的测试结果作为最佳测试结果,将所述多个图 像加工处理中与所述最佳测试结果对应的图像加工处理决定为最适加 工处理,所述图像生成单元针对所述扫描图像实施所述最适加工处理来 生成所述识别对象图像。

第13方面的发明涉及的电子文件生成装置的控制方法是与云服务 器合作来生成电子文件的电子文件生成装置的控制方法,所述云服务器 将光学文字识别处理的处理对象图像内的文字区域划分为能分别包含 比一行的行区域大的区域的多个单位识别区域,并且针对所述多个单位 识别区域的每一个执行所述光学文字识别处理,所述云服务器生成包括 针对所述多个单位识别区域的每一个的文字识别结果并且在针对各单 位识别区域的文字识别结果的末尾分别附加了分割码的文本数据来作 为针对所述处理对象图像的所述光学文字识别处理的处理结果,该电子 文件生成装置的控制方法的特征在于,具备:a)从原稿的扫描图像的 文字区域分别提取多个行区域的步骤;b)以所述多个行区域的每一个 被所述云服务器判定为单位识别区域的方式,针对所述扫描图像实施图 像加工处理来生成识别对象图像的步骤;c)将所述识别对象图像作为 所述光学文字识别处理的所述处理对象图像发送给所述云服务器的步 骤;d)从所述云服务器接收作为针对所述识别对象图像的所述光学文 字识别处理的处理结果的所述文本数据的步骤;e)基于所述文本数据 所含的所述分割码将所述文本数据划分为多个字符串数据,并且决定所 述多个行区域与所述多个字符串数据的对应关系的步骤;以及f)在与 各字符串数据对应的各行区域分别配置该各字符串数据来生成所述电 子文件的步骤。

第14方面的发明基于第13方面的发明涉及的控制方法而提出,其 特征在于,所述电子文件生成装置的控制方法还具备:g)分别检测所 述多个行区域的在所述扫描图像内的位置的步骤,在所述步骤f)中, 基于所述步骤g)中的检测位置,在与所述各字符串数据对应的所述各 行区域的检测位置分别配置所述各字符串数据来生成所述电子文件。

第15方面的发明基于第13方面或者第14方面的发明涉及的控制 方法而提出,其特征在于,所述图像加工处理包括:检测所述多个行区 域各自的高度,并将所述多个行区域的相互间的分离间隔分别设定为所 述多个行区域中最高的行区域的高度以上的大小的处理。

第16方面的发明基于第13方面或者第14方面的发明涉及的控制 方法而提出,其特征在于,所述图像加工处理包括:检测所述多个行区 域各自的高度,并将所述多个行区域中最终行以外的各行区域与该各行 区域各自的下一行区域的相互间的分离间隔,分别设定为所述各行区域 各自的高度以上的大小的处理。

第17方面的发明基于第13方面或者第14方面的发明涉及的控制 方法而提出,其特征在于,所述图像加工处理包括:对所述多个行区域 的相互间的行间区域分别附加分割线的处理。

第18方面的发明基于第13方面或者第14方面的发明涉及的控制 方法而提出,其特征在于,所述图像加工处理包括:在所述多个行区域 中至少最终行以外的各行区域各自的末尾附加表示是所述单位识别区 域的末尾的末尾识别图像的处理。

第19方面的发明基于第13方面或者第14方面的发明涉及的控制 方法而提出,其特征在于,所述图像加工处理包括:将各行区域的文字 颜色设定为与和所述各行区域分别邻接的邻接行区域的文字颜色不同 的文字颜色的处理。

第20方面的发明基于第13方面或者第14方面的发明涉及的控制 方法而提出,其特征在于,所述图像加工处理包括:将各行区域的行头 位置设定在与和所述各行区域分别邻接的邻接行区域的行头位置不同 的位置的处理。

第21方面的发明基于第13方面或者第14方面的发明涉及的控制 方法而提出,其特征在于,所述图像加工处理包括:将各行区域的文字 尺寸设定为与和所述各行区域分别邻接的邻接行区域的文字尺寸不同 的文字尺寸的处理。

第22方面的发明基于第13方面或者第14方面的发明涉及的控制 方法而提出,其特征在于,所述电子文件生成装置的控制方法还具备: h)在所述步骤b)之前向所述云服务器查询由所述云服务器在所述单位 识别区域的判定中使用的判定手法的步骤;和i)从所述云服务器接收 与所述判定手法相关的信息的步骤,在所述步骤b)中,针对所述扫描 图像实施与所述判定手法对应的图像加工处理来生成所述识别对象图 像。

第23方面的发明基于第13方面或者第14方面的发明涉及的控制 方法而提出,其特征在于,所述电子文件生成装置的控制方法还具备: h)在所述步骤b)之前,生成相互不同的多个测试图像的步骤,所述多 个测试图像被分别实施了相互不同的多个图像加工处理且分别包含所 述多个行区域中的一部分的行区域;i)将所述多个测试图像发送给所 述云服务器的步骤;j)从所述云服务器接收作为针对所述多个测试图 像分别执行的所述光学文字识别处理的处理结果的多个测试结果的步 骤;k)基于从所述云服务器接收到的所述多个测试结果的每一个所含 的分割码,来检测所述多个测试结果的每一个所含的字符串数据的个数 即字符串数据数的步骤;以及l)针对所述多个测试结果的每一个求出 其字符串数据数与所述一部分的行区域的个数之差即个数差,并且求出 所述多个测试结果中所述个数差最小的测试结果作为最佳测试结果,将 所述多个图像加工处理中与所述最佳测试结果对应的图像加工处理决 定为最适加工处理的步骤,在所述步骤b)中,关于所述多个行区域中 除了所述一部分的行区域之外的剩余的行区域,实施所述最适加工处理 来生成所述识别对象图像,在所述步骤e)中,基于所述最佳测试结果 所含的分割码和所述文本数据所含的分割码,来将由所述最佳测试结果 和所述文本数据构成的数据划分为多个字符串数据,并且决定所述多个 行区域与所述多个字符串数据的对应关系。

第24方面的发明基于第13方面或者第14方面的发明涉及的控制 方法而提出,其特征在于,所述电子文件生成装置的控制方法还具备: h)在所述步骤b)之前,将针对样本图像分别实施相互不同的多个图像 加工处理而生成的多个测试图像发送给所述云服务器的步骤;i)从所 述云服务器接收作为针对所述多个测试图像分别执行的所述光学文字 识别处理的处理结果的多个测试结果的步骤;j)基于从所述云服务器 接收到的所述多个测试结果的每一个所含的分割码,来检测所述多个测 试结果的每一个所含的字符串数据的个数即字符串数据数的步骤;以及 k)针对所述多个测试结果的每一个求出其字符串数据数与所述样本图 像所含的行区域的个数之差即个数差,并且求出所述多个测试结果中所 述个数差最小的测试结果作为最佳测试结果,将所述多个图像加工处理 中与所述最佳测试结果对应的图像加工处理决定为最适加工处理的步 骤,在所述步骤b)中,针对所述扫描图像实施所述最适加工处理来生 成所述识别对象图像。

第25方面的发明涉及一种电子文件生成系统,其特征在于,该电 子文件生成系统具备:生成原稿的扫描图像的图像形成装置、和与云服 务器合作来生成基于所述扫描图像的电子文件的电子文件生成装置,所 述云服务器将光学文字识别处理的处理对象图像内的文字区域划分为 能分别包含比一行的行区域大的区域的多个单位识别区域,并且针对所 述多个单位识别区域的每一个执行所述光学文字识别处理,所述云服务 器生成包括针对所述多个单位识别区域的每一个的文字识别结果并且 在针对各单位识别区域的文字识别结果的末尾分别附加了分割码的文 本数据来作为针对所述处理对象图像的所述光学文字识别处理的处理 结果,所述图像形成装置具有将所述扫描图像发送给所述电子文件生成 装置的通信单元,所述电子文件生成装置具有:提取单元,其从自所述 图像形成装置接收到的所述扫描图像的文字区域分别提取多个行区域; 图像生成单元,其以所述多个行区域的每一个被所述云服务器判定为单 位识别区域的方式,针对所述扫描图像实施图像加工处理来生成识别对 象图像;发送单元,其将所述识别对象图像作为所述光学文字识别处理 的所述处理对象图像发送给所述云服务器;接收单元,其从所述云服务 器接收作为针对所述识别对象图像的所述光学文字识别处理的处理结 果的所述文本数据;以及文件生成单元,其基于所述文本数据所含的所 述分割码来将所述文本数据划分为多个字符串数据,并且决定所述多个 行区域与所述多个字符串数据的对应关系,在与各字符串数据对应的各 行区域分别配置该各字符串数据来生成所述电子文件。

第26方面的发明基于第25方面的发明涉及的电子文件生成系统而 提出,其特征在于,所述电子文件生成装置还具备对所述多个行区域的 在所述扫描图像内的位置分别进行检测的检测单元,所述文件生成单元 在与所述各字符串数据对应的所述各行区域的检测位置分别配置所述 各字符串数据来生成所述电子文件。

第27方面的发明基于第25方面或者第26方面的发明涉及的电子文 件生成系统而提出,其特征在于,所述图像加工处理包括:检测所述多 个行区域各自的高度,并将所述多个行区域的相互间的分离间隔分别设 定为所述多个行区域中最高的行区域的高度以上的大小的处理。

第28方面的发明基于第25方面或者第26方面的发明涉及的电子文 件生成系统而提出,其特征在于,所述图像加工处理包括:检测所述多 个行区域各自的高度,并将所述多个行区域中最终行以外的各行区域与 该各行区域各自的下一行区域的相互间的分离间隔,分别设定为所述各 行区域各自的高度以上的大小的处理。

第29方面的发明基于第25方面或者第26方面的发明涉及的电子文 件生成系统而提出,其特征在于,所述图像加工处理包括:对所述多个 行区域的相互间的行间区域分别附加分割线的处理。

第30方面的发明基于第25方面或者第26方面的发明涉及的电子文 件生成系统而提出,其特征在于,所述图像加工处理包括:在所述多个 行区域中至少最终行以外的各行区域各自的末尾附加表示是所述单位 识别区域的末尾的末尾识别图像的处理。

第31方面的发明基于第25方面或者第26方面的发明涉及的电子文 件生成系统而提出,其特征在于,所述图像加工处理包括:将各行区域 的文字颜色设定为与和所述各行区域分别邻接的邻接行区域的文字颜 色不同的文字颜色的处理。

第32方面的发明基于第25方面或者第26方面的发明涉及的电子文 件生成系统而提出,其特征在于,所述图像加工处理包括:将各行区域 的行头位置设定在与和所述各行区域分别邻接的邻接行区域的行头位 置不同的位置的处理。

第33方面的发明基于第25方面或者第26方面的发明涉及的电子文 件生成系统而提出,其特征在于,所述图像加工处理包括:将各行区域 的文字尺寸设定为与和所述各行区域分别邻接的邻接行区域的文字尺 寸不同的文字尺寸的处理。

第34方面的发明基于第25方面或者第26方面的发明涉及的电子文 件生成系统而提出,其特征在于,所述发送单元在所述识别对象图像的 生成之前向所述云服务器查询由所述云服务器在所述单位识别区域的 判定中使用的判定手法,所述接收单元从所述云服务器接收与所述判定 手法相关的信息,所述图像生成单元针对所述扫描图像实施与所述判定 手法对应的图像加工处理来生成所述识别对象图像。

第35方面的发明基于第25方面或者第26方面的发明涉及的电子文 件生成系统而提出,其特征在于,所述图像生成单元生成相互不同的多 个测试图像,所述多个测试图像被分别实施了相互不同的多个图像加工 处理且分别包含所述多个行区域中的一部分的行区域,所述发送单元将 所述多个测试图像发送给所述云服务器,所述接收单元从所述云服务器 接收作为针对所述多个测试图像分别执行的所述光学文字识别处理的 处理结果的多个测试结果,所述图像生成单元基于所述多个测试结果的 每一个所含的分割码,来检测所述多个测试结果的每一个所含的字符串 数据的个数即字符串数据数,所述图像生成单元针对所述多个测试结果 的每一个求出其字符串数据数与所述一部分的行区域的个数之差即个 数差,并且求出所述多个测试结果中所述个数差最小的测试结果作为最 佳测试结果,将所述多个图像加工处理中与所述最佳测试结果对应的图 像加工处理决定为最适加工处理,关于所述多个行区域中除了所述一部 分的行区域之外的剩余的行区域,实施所述最适加工处理来生成所述识 别对象图像,所述文件生成单元基于所述最佳测试结果所含的分割码和 所述文本数据所含的分割码,来将由所述最佳测试结果和所述文本数据 构成的数据划分为多个字符串数据,并且,决定所述多个行区域与所述 多个字符串数据的对应关系,在与各字符串数据对应的各行区域分别配 置该各字符串数据来生成所述电子文件。

第36方面的发明基于第25方面或者第26方面的发明涉及的电子文 件生成系统而提出,其特征在于,所述发送单元将针对样本图像分别实 施相互不同的多个图像加工处理而生成的多个测试图像发送给所述云 服务器,所述接收单元从所述云服务器接收作为针对所述多个测试图像 分别执行的所述光学文字识别处理的处理结果的多个测试结果,所述图 像生成单元基于所述多个测试结果的每一个所含的分割码,来检测所述 多个测试结果的每一个所含的字符串数据的个数即字符串数据数,所述 图像生成单元针对所述多个测试结果的每一个求出其字符串数据数与 所述样本图像所含的行区域的个数之差即个数差,并且求出所述多个测 试结果中所述个数差最小的测试结果作为最佳测试结果,将所述多个图 像加工处理中与所述最佳测试结果对应的图像加工处理决定为最适加 工处理,针对所述扫描图像实施所述最适加工处理来生成所述识别对象 图像。

根据第1方面至第36方面的发明,从扫描图像分别提取多个行区 域,以该多个行区域的每一个被云服务器判定为单位识别区域的方式, 针对该扫描图像实施图像加工处理来生成识别对象图像。而且,在云服 务器中,该多个行区域的每一个被判定为单位识别区域,生成在针对各 行区域的文字识别结果的末尾分别附加了分割码的文本数据。因此,由 于电子文件生成装置能够基于该分割码使扫描图像内的各行区域与针 对各行区域的文字识别结果建立对应,所以能够生成在扫描图像内的适 当的位置配置了OCR处理结果(文本数据)的电子文件。

附图说明

图1是表示电子文件生成系统的图。

图2是表示图像形成装置(MFP)的功能模块的图。

图3是表示外部终端的概略结构的功能框图。

图4是表示电子文件生成系统中的动作例的时序图。

图5是表示扫描图像的图。

图6是表示各行区域与各行区域的坐标位置的图。

图7是表示各行区域的高度的图。

图8是表示处理对象图像的图。

图9是表示在各行区域配置各字符串数据的样子的图。

图10是表示生成的带即时搜索功能的PDF文件的图。

图11是表示第1实施方式的变形例涉及的处理对象图像的图。

图12是表示第2实施方式涉及的处理对象图像的图。

图13是表示第3实施方式涉及的处理对象图像的图。

图14是表示第4实施方式涉及的处理对象图像的图。

图15是表示第5实施方式涉及的处理对象图像的图。

图16是表示第6实施方式涉及的处理对象图像的图。

图17是表示第7实施方式涉及的电子文件生成系统中的动作例的时 序图。

图18是表示第8实施方式涉及的电子文件生成系统中的动作例的时 序图。

图19是对一部分的行区域的提取进行说明的图。

图20是表示测试图像的图。

图21是表示测试图像的图。

图22是表示测试图像的图。

图23是对最适加工处理的决定处理进行说明的图。

图24是表示与剩余的行区域相关的识别对象图像的图。

图25是表示与剩余的行区域相关的文本数据的图。

图26是表示变形例涉及的识别对象图像的图。

附图标记说明:1...图像形成系统(电子文件生成系统);10...MFP (图像形成装置);50...外部终端;90...云服务器;200、201...扫描 图像;400~407...行区域;430~436...末尾识别图像;451~457... 字符串数据;500~506、511、541...识别对象图像;530~533...测试 图像;570~573...测试结果;550、551、581...文本数据;600、601... 电子文件。

具体实施方式

以下,基于附图对本发明的实施方式进行说明。

<1.第1实施方式>

<1-1.构成概要>

图1是表示本发明涉及的图像形成系统1的图。如图1所示,图像 形成系统1具备图像形成装置10、外部终端50和云服务器90。

图像形成装置10、外部终端50与云服务器90经由网络(通信网络) 108相互连接。网络108由LAN(LocalAreaNetwork)以及互联网等 构成。另外,与网络108的连接方式可以是有线连接,或者也可以是无 线连接。例如,图像形成装置10以及云服务器90与网络108有线连接, 外部终端50与网络108无线连接。

云服务器90是与图像形成装置10以及外部终端50都不同的外部 装置(外部服务器)。云服务器90是提供通用的OCR(OpticalCharacter Recognition)处理服务的服务器。不过,该云服务器90不提供带即时 搜索功能的PDF(PortableDocumentFormat)文件的生成处理服务。 带即时搜索功能的PDF文件如后述那样,通过外部终端50以及云服务 器90等进行配合而生成。

另外,云服务器90基于规定的判定基准,将OCR处理的处理对象 图像内的文字区域划分为能分别包含比一行的行区域大的区域的多个 单位识别区域,并且针对该多个单位识别区域的每一个执行OCR处理。 而且,作为针对该处理对象图像的OCR处理结果,云服务器90生成文 本数据550(参照图9)。该文本数据550中包括:针对该多个单位识别 区域的每一个的文字识别结果(OCR处理结果),并且,在针对各单位识 别区域的文字识别结果的末尾分别被附加分割码(例如换行码(控制 码))。其中,该文本数据550也被表现为是由文字码(包括:分割码等) 构成的数据的集合体(文字码组数据)。

在该图像形成系统1中,原稿的扫描图像200(参照图5)由图像 形成装置10生成,该扫描图像200被从图像形成装置10发送给外部终 端50。外部终端50针对该扫描图像200实施图像加工处理(后述)而 生成识别对象图像500(参照图8),并将该识别对象图像500发送给云 服务器90。云服务器90针对从外部终端50接收到的识别对象图像500 实施OCR处理,作为OCR处理结果而生成文本数据550,并将该文本数 据550发送给外部终端50。而且,外部终端50基于从云服务器90接收 到的文本数据550来生成电子文件600(参照图10)。该电子文件600 作为带文本数据的电子文件(这里是带即时搜索功能的PDF文件)而生 成。

其中,由于图像形成系统1也是生成电子文件的系统,所以也被表 现为电子文件生成系统等。同样,外部终端50也被表现为是“电子文 件生成装置”。

<1-2.图像形成装置的结构>

图2是表示图像形成装置10的功能模块的图。这里,作为图像形成 装置10,例示MFP(多功能数码复合一体机(Multi-Functional Peripheral))。

MFP10是具备扫描功能、复印功能、传真功能以及邮箱储存功能等 的装置(也称为复合机)。具体而言,MFP10如图2的功能框图所示,具 备图像读取部2、打印输出部3、通信部4、储存部5、操作部6以及控 制器9等,通过使这些各部以复合方式进行动作,来实现各种功能。

图像读取部2是以光学方式读取载置于MFP10的规定的位置的原稿 来生成该原稿的图像数据(也称为扫描图像)的处理部。

打印输出部3是基于与打印对象相关的数据来向纸等各种介质打印 输出图像的输出部。

通信部4是能够进行经由公用线路等的传真通信的处理部。并且, 通信部4还能够进行经由网络108的网络通信。在该网络通信中,例如 可利用TCP/IP(TransmissionControlProtocol/InternetProtocol) 等各种协议。通过利用该网络通信,MFP10能够与所希望的对象目的地 (例如,外部终端50)进行合作来收受各种数据。通信部4具有发送各 种数据的发送部4a和接收各种数据的接收部4b。

储存部5由硬盘驱动器(HDD)等存储装置构成。

操作部6具备受理针对MFP10的操作输入的操作输入部6a、和进行 各种信息的显示输出的显示部6b。

在该MFP10中,设有近似板状的操作面板部6c(参照图1)。另外, 操作面板部6c在其正面侧具有触摸面板25(参照图1)。触摸面板25 既作为操作输入部6a的一部分发挥功能,并且还作为显示部6b的一部 分发挥功能。触摸面板25通过在液晶显示面板中嵌入各种传感器等而 构成,能够显示各种信息并且受理来自操作者的各种操作输入。

例如,在触摸面板25中显示各种操作画面(包括:按钮图像等)。 操作者通过按下在触摸面板25的操作画面内虚拟配置的按钮,能够设 定MFP10的各种动作内容并且赋予动作指示。

控制器9是被内置于MFP10,来统一控制MFP10的控制装置。控制 器9构成为具备CPU以及各种半导体存储器(RAM以及ROM)等的计算 机系统。控制器9通过在CPU中执行ROM(例如,EEPROM)内所储存的 规定的软件程序(以下也简称为程序)P1,来实现各种处理部。此外, 该程序(详细而言为程序模块组)P1也可以经由USB存储器等便携式记 录介质或者网络108等被安装于MFP10。

具体如图2所示,控制器9通过程序P1的执行,来实现包括:通 信控制部11、输入控制部12和显示控制部13的各种处理部。

通信控制部11是与通信部4等进行配合来控制与其他装置(外部 终端50等)之间的通信动作的处理部。例如,通信控制部11将扫描图 像200等发送给外部终端50。

输入控制部12是对用户针对操作输入部6a的操作输入的受理动作 等进行控制的控制部。

显示控制部13是控制显示部6b中的显示动作的处理部。显示控制 部13例如使用于操作MFP10的操作画面显示于触摸面板25。

<1-3.外部终端的结构>

接着,对外部终端50的结构进行说明。

外部终端50是能够与MFP10以及云服务器90之间进行网络通信的 信息输入输出终端装置(也被称为信息终端或者通信终端)。这里,作 为外部终端50,例示平板型终端。但并不局限于此,外部终端50也可 以是智能电话或者个人计算机等。另外,外部终端也可以是便携式的装 置(便携信息终端等)(便携终端),或者也可以是固定型的装置。

图3是表示外部终端50的概略结构的功能框图。

外部终端50如图3的功能框图所示,具备通信部54、储存部55、 操作部56以及控制器59等,通过使这些各部以复合方式进行动作,来 实现各种功能。

通信部54能够进行经由网络108的网络通信。在该网络通信中, 例如可利用TCP/IP(TransmissionControlProtocol/Internet Protocol)等各种协议。通过利用该网络通信,外部终端50能够与所 希望的对象目的地(MFP10以及云服务器90等)进行合作来收受各种数 据。通信部54具有发送各种数据的发送部54a和接收各种数据的接收 部54b。例如,接收部54b从MFP10接收扫描图像200,发送部54a将 识别对象图像500(后述)发送给云服务器90。另外,接收部54b从云 服务器90接收针对识别对象图像500的OCR处理结果(文本数据)等。

储存部55由非易失性的半导体存储器等存储装置构成,储存各种 信息。例如,储存部55中储存有从扫描图像200的文字区域300(参照 图6)提取的多个行区域400(参照图6)各自的在该扫描图像200内的 坐标位置。

操作部56具备受理针对外部终端50的操作输入的操作输入部56a、 和进行各种信息的显示输出的显示部56b。在该外部终端50中,设有通 过在液晶显示面板中嵌入各种传感器等而构成的触摸面板75(参照图 1)。具体如图1所示,在近似板状的外部终端50的正面侧,遍布除了 其周边部(框部)之外的几乎整个面设有触摸面板75。换言之,触摸面 板75既作为操作输入部56a的一部分发挥功能,并且还作为显示部56b 的一部分发挥功能。

控制器59是被内置于外部终端50,来统一控制外部终端50的控制 装置。控制器59构成为具备CPU以及各种半导体存储器(RAM以及ROM) 等的计算机系统。控制器59通过在CPU中执行存储部(半导体存储器 等)内所储存的规定的软件程序(以下也简称为程序)P2,来实现各种 处理部。此外,该程序(详细而言为程序模块组)P2也可以经由USB 存储器等便携式记录介质或者网络108等被安装于外部终端50。

具体而言,控制器59通过程序P2等的执行,来实现包括:通信控 制部61、输入控制部62、显示控制部63、提取部64、检测部65、图像 生成部66和文件生成部67的各种处理部。

通信控制部61是与通信部54等进行配合,来控制与MFP10以及云 服务器90等的通信动作的处理部。

输入控制部62是对用户针对操作输入部56a的操作输入的受理动 作等进行控制的控制部。

显示控制部63是控制显示部56b中的显示动作的处理部。显示控 制部63例如将用于进行与MFP10的合作处理的操作画面显示于触摸面 板75。

提取部64是从扫描图像200的文字区域300分别提取多个行区域 400(参照图6)的处理部。

检测部65是分别检测多个行区域400在扫描图像200内的位置(坐 标位置)的处理部。

图像生成部66是以多个行区域400的每一个被云服务器90判定为 单位识别区域的方式,对扫描图像200实施图像加工处理(后述)来生 成识别对象图像500的处理部。

文件生成部67是生成电子文件600(参照图10)的处理部。文件 生成部67基于从云服务器90接收到的文本数据550所含的分割码,将 该文本数据550划分为多个字符串数据(451~457等)(参照图9),并 且,决定扫描图像200内的多个行区域400与该多个字符串数据(451~ 457等)的对应关系。文件生成部67对与各字符串数据(451~457等) 对应的各行区域400分别配置该各字符串数据(451~457等)来生成电 子文件600(带即时搜索功能的PDF文件等)。

<1-4.动作>

在该图像形成系统1中,如上述那样,外部终端50针对扫描图像 200实施“图像加工处理”来生成识别对象图像500,并将该识别对象 图像500发送给云服务器90。

在该第1实施方式中,云服务器90基于OCR处理的处理对象图像 内的行区域的相互间的分离间隔来判定(识别)单位识别区域。具体而 言,在处理对象图像内的某一行区域与下一行区域的分离间隔比较小的 (详细而言,该分离间隔比该某一行区域的高度小的)情况下,云服务 器90不对该某一行区域与该下一行区域进行区分。而且,云服务器90 生成该某一行区域的文字识别结果(OCR处理结果)与下一行区域的文 字识别结果连续的状态的文本数据。另一方面,在处理对象图像内的某 一行区域与下一行区域的分离间隔比较大的(详细而言,该分离间隔比 该某一行区域的高度大的)情况下,云服务器90将处理对象图像内的 到该某一行区域为止的1个或者2个以上的行区域与该下一行区域以后 的1个或者2个以上的行区域分别判定为单位识别区域。而且,云服务 器90生成在针对各单位识别区域的文字识别结果的末尾分别附加了分 割码(这里为换行码)的文本数据550。基于这样的判定基准,云服务 器90将处理对象图像内的文字区域划分为多个单位识别区域。

另外,在第1实施方式中,外部终端50执行将扫描图像200内的 多个行区域400的相互间的分离间隔分别设定为该多个行区域400中最 高的行区域的高度(最大高度H)以上的大小的处理作为“图像加工处 理”。外部终端50通过实施这样的“图像加工处理”,来(有意图地) 使云服务器90判定为该多个行区域400是相互不同的单位识别区域, 从云服务器90取得所希望的处理结果(在针对各行区域400的文字识 别结果的末尾分别附加了分割码的文本数据550)。

其中,这里假设为由云服务器90在单位识别区域的判定中使用的 判定手法(单位识别区域的判定基准)是已知的。更详细而言,假设为 程序设计者等通过云服务器90中的OCR处理的式样的公开等而知晓该 判定手法,制成该判定手法所对应的与“图像加工处理”相关的程序, 并且,该程序被安装到外部终端50。

<扫描图像生成等>

首先,用户将扫描对象的原稿载置到MFP10的原稿台(例如自动给 纸装置(ADF:AutoDocumentFeeder)或者原稿载置用玻璃面等), 在外部终端50的操作画面中将电子文件600(601)的生成指示赋予给 外部终端50。外部终端50若受理了该生成指示,则将基于该生成指示 的扫描图像生成指示转送给MFP10。

在指示生成电子文件600(601)时,用户指定通过扫描处理最终生 成的电子文件600(601)的文件形式。这里,作为该电子文件601的文 件形式,被指定带即时搜索功能的PDF(带透明文本的PDF)文件。其 中,带即时搜索功能的PDF(带透明文本的PDF)文件是具备:具有文 字图像的图像层、和针对该文字图像的文字识别结果(文本数据)以非 显示状态被嵌入的文本层的PDF形式的电子文件。

MFP10若从外部终端50接收到该生成指示(扫描图像生成指示等), 则开始扫描动作,生成在MFP10的原稿台(ADF等)上载置的原稿的扫 描图像200(201)(参照图5)。

而且,MFP10将扫描图像(详细而言为扫描图像数据)201发送给 外部终端50。

<OCR处理以及电子文件生成处理等>

图4是表示电子文件生成系统1中的动作例的时序图。外部终端50 (以及云服务器90)若接收到来自MFP10的扫描图像200(201),则执 行图4所示那样的处理。

外部终端50若从MFP10接收而取得扫描图像201(参照图5)(步 骤S11),则如图6所示,从该扫描图像201的文字区域300(301)分 别提取多个行区域400(401~407)(步骤S12)。具体而言,外部终端 50(提取部64)通过图像处理将扫描图像201划分为文字区域301和非 文字区域,并从该文字区域301分别提取行区域(一行单位的区域)401~ 407。

若行区域401~407被提取,则外部终端50(检测部65)分别检测 行区域401~407在扫描图像201内的位置(坐标位置)(参照图6),并 将各坐标位置储存到储存部55(步骤S13)。这里,如图6所示,行区 域401~407的左上端在扫描图像201内的坐标位置被分别检测,行区 域401~407的坐标位置(坐标值(X1,Y1)~(X7,Y7))被分别储存 到储存部55。

而且,外部终端50(图像生成部66)以多个行区域(行区域401~ 407)的每一个被云服务器90判定为单位识别区域的方式,针对扫描图 像201实施图像加工处理(下述)(步骤S14),来生成识别对象图像501 (501A)(图8)(步骤S15)。

具体而言,图像生成部66通过图像处理分别检测扫描图像201内 的行区域401~407的高度H1~H7(图7),并决定行区域401~407中 最高的行区域的高度(最大高度H)。这里,行区域401~407的高度H1~ H7中的行区域401的高度H1被决定为最大高度H。而且,图像生成部 66将行区域401~407的相互间的分离间隔分别设定为对该最大高度H 加上了规定值ΔH(例如2毫米)后的大小H10(=H+ΔH)。图像生成 部66将这样的处理作为“图像加工处理”来对扫描图像201实施(步 骤S14),生成识别对象图像501A(步骤S15)。这里,如图8所示,行 区域401~407的相互间的分离间隔分别被设定为对最大高度(行区域 401的高度)H1加上了ΔH后的大小H11(=H1+ΔH),生成识别对象 图像501A。换言之,生成行区域401~407的每一个空开最大高度H1 以上的大小H11(=H1+ΔH)的间隔而配置的识别对象图像501A。

而且,外部终端50(发送部54a)将该识别对象图像501A作为OCR 处理的处理对象图像发送给云服务器90(步骤S16)。其中,外部终端 50伴随着该识别对象图像501A的发送,还将内容为应该开始针对该识 别对象图像501A的OCR处理的OCR开始指令发送给云服务器90。

云服务器90若从外部终端50接收到识别对象图像501A以及OCR 开始指令,则将该识别对象图像501A识别为OCR处理的处理对象图像, 针对识别对象图像501A执行OCR处理来生成文本数据551(步骤S17)。

具体而言,云服务器90基于识别对象图像501A内的行区域401~ 407的相互间的分离间隔为最大高度H1以上的大小H11(=H1+ΔH) (即,该分离间隔比各行区域401~407各自的高度大),将该行区域 401~407的每一个判定为相互不同的单位识别区域。而且,云服务器 90针对识别对象图像501A实施OCR处理,生成文本数据551(图9的 右上部)作为针对识别对象图像501A的OCR处理结果。如图9的右上 部所示,该文本数据551中包括:针对行区域401~407的每一个的文 字识别结果(OCR处理结果),并且,在针对行区域401~407的文字识 别结果(OCR处理结果)的末尾分别附加了分割码(这里为换行码)。换 言之,该文本数据551中包括:针对行区域401~407的每一个的文字 识别结果(文本数据)和7个换行码。

然后,云服务器90将该文本数据(针对识别对象图像501A的OCR 处理结果)551发送给外部终端50(步骤S18)。

外部终端50(文件生成部67)若从云服务器90接收到该文本数据 551,则基于各行区域401~407在扫描图像201内的检测位置(坐标位 置)将各字符串数据451~457(下述)分别配置于各行区域401~407 来生成电子文件600(601)(图10)(步骤S19)。

具体如图9所示,文件生成部67基于文本数据551所含的7个换 行码,将该文本数据551划分为7个字符串数据451~457。而且,文件 生成部67将第一个字符串数据451决定为与扫描图像201内的第一行 的行区域401对应的字符串数据,将该字符串数据451配置于行区域401 的检测位置(坐标值(X1,Y1))。换言之,文件生成部67使第一个字 符串数据451与第一行的行区域401建立对应,将该字符串数据451配 置于行区域401的检测位置。同样,文件生成部67使字符串数据452~ 457与行区域402~407分别建立对应,将该字符串数据452~457分别 配置于行区域402~407的检测位置(坐标位置)(参照图9)。

而且,若在全部的行区域401~407配置了全部的字符串数据451~ 457,则文件生成部67生成带即时搜索功能的PDF(带透明文本的PDF) 文件作为电子文件601(参照图10)。如图10所示,在该电子文件601 (带即时搜索功能的PDF文件)中,字符串数据451~457作为透明文 本数据(以非显示状态)被分别嵌入行区域401~407的各坐标位置。 其中,在图10中,为了便于图示,行区域401~407的文字图像未被显 示而显示了OCR处理结果(字符串数据451~457),但实际上,在该电 子文件601中,不显示该字符串数据451~457,而显示行区域401~407 的文字图像。

这样,文件生成部67基于文本数据551所含的分割码(这里为换 行码)将该文本数据551划分为字符串数据451~457,并决定行区域 401~407与该字符串数据451~457的对应关系。而且,文件生成部67 将各字符串数据451~457分别配置到与该各字符串数据451~457对应 的各行区域401~407的检测位置来生成电子文件601。

综上所述,在第1实施方式涉及的动作中,从扫描图像201分别提 取行区域401~407,并以行区域401~407的每一个被云服务器90判 定为单位识别区域的方式实施图像加工处理来生成识别对象图像501。 而且,在云服务器90中,行区域401~407的每一个被判定为单位识别 区域,并生成在针对行区域401~407的文字识别结果的末尾分别附加 了分割码的文本数据551。因此,由于外部终端50能够基于该分割码使 扫描图像201内的行区域401~407与针对行区域401~407的文字识别 结果(字符串数据451~457)建立对应,所以能够生成在扫描图像201 内的适当的位置配置了OCR处理结果(文本数据)的电子文件601。

另外,由于分别检测出行区域401~407在扫描图像201内的位置 (坐标位置),并在与字符串数据451~457对应的行区域401~407的 检测位置分别配置该字符串数据451~457,所以能够生成在扫描图像 201内的更适当的位置配置了OCR处理结果(文本数据)的电子文件601。

此外,在第1实施方式中,例示了将多个行区域的相互间的分离间 隔分别设定为最大高度H以上的大小H10的处理作为“图像加工处理” 被实施的方式,但并不限定于此。例如,将各行区域与该各行区域各自 的下一行区域的相互间的分离间隔分别设定为该各行区域各自的高度 以上的大小H20的处理也可以作为“图像加工处理”而被实施。

具体而言,图像生成部66分别检测扫描图像201内的行区域401~ 407的行区域的高度H1~H7(参照图7)。而且,图像生成部66如图11 所示那样,将行区域401与(下一)行区域402的相互间的分离间隔设 定为高度H1以上的大小H21(=H1+ΔH)。另外,图像生成部66将行 区域402与(下一)行区域403的相互间的分离间隔设定为高度H2以 上的大小H22(=H2+ΔH)。同样,图像生成部66将行区域403~406 与(各自的下一)行区域404~407的相互间的分离间隔分别设定为高 度H3~H6以上的大小H23~H26(=Hi+ΔH(i=3,...,6))。换言 之,图像生成部66将行区域401~407中的最终行以外的各行区域401~ 406与该各行区域401~406各自的下一行区域402~407的相互间的分 离间隔分别设定为该各行区域401~406的高度H1~H6以上的大小 H21~H26。而且,图像生成部66实施这样的图像加工处理来生成识别 对象图像501(501B)(图11)。

此外,在该变形例中,也如上述那样,在处理对象图像内的某一行 区域与下一行区域的分离间隔比该某一行区域的高度大的情况下,云服 务器90将处理对象图像内的到该某一行区域为止的1个或者2个以上 的行区域与该下一行区域以后的1个或者2个以上的行区域分别判定为 单位识别区域。

而且,通过进行上述的变形例涉及的图像加工处理,由于各行区 域与该各行区域各自的下一行区域的相互间的分离间隔被分别设定为 该各行区域各自的高度以上的大小,所以在云服务器90中各行区域的 每一个被判定为相互不同的单位识别区域。

<2.第2实施方式>

第2实施方式是第1实施方式的变形例。以下,以与第1实施方式 的不同点为中心来进行说明。

在第1实施方式中,例示了云服务器90在处理对象图像内的某一 行区域与下一行区域的分离间隔比该某一行区域的高度大的情况下,将 到该某一行区域为止的1个或者2个以上的行区域与该下一行区域以后 的1个或者2个以上的行区域分别判定为单位识别区域的方式。另外, 在第1实施方式中,例示了外部终端50执行将扫描图像200内的多个 行区域400的相互间的分离间隔分别设定为该多个行区域400中最高的 行区域的高度(最大高度H)以上的大小的处理作为“图像加工处理” 的方式。

然而,本申请发明并不限定于此。例如,云服务器90也可以基于 其它的各种判定基准(判定手法)来进行单位识别区域的判定,外部终 端50针对扫描图像200执行与各种判定手法对应的“图像加工处理”。 在以下的第2~第6实施方式中,分别例示这样的方式。

在该第2实施方式中,设云服务器90基于OCR处理的处理对象图 像内的分割线来判定(识别)单位识别区域。具体而言,当在处理对象 图像内存在分割线时,云服务器90将被该分割线划分后的各区域(上 侧的1个或者2个以上的行区域与下侧的1个或者2个以上的行区域这 两个区域)分别判定为单位识别区域。而且,云服务器90生成在针对 各单位识别区域的文字识别结果的末尾分别附加了分割码的文本数据 550。基于这样的判定基准,云服务器90将处理对象图像内的文字区域 划分为多个单位识别区域。

另外,在第2实施方式中,例示外部终端50执行对扫描图像200 内的多个行区域400的相互间的行间区域分别附加分割线L(图12)的 处理作为“图像加工处理”的方式。外部终端50通过实施这样的“图 像加工处理”,来(有意图地)使云服务器90判定为该多个行区域400 是相互不同的单位识别区域,从云服务器90取得所希望的处理结果(在 针对各行区域400的文字识别结果的末尾分别附加了分割码的文本数据 550)。

在第2实施方式中,也与第1实施方式同样地分别进行图4的各 处理。

但是,第2实施方式的图像加工处理(步骤S14)的处理内容与 第1实施方式的图像加工处理(步骤S14)的处理内容不同。

具体如图12所示,外部终端50(图像生成部66)针对扫描图像 201实施对扫描图像201内的行区域401~407的相互间的行间区域分 别附加分割线L(L1~L6)的处理作为“图像加工处理”(步骤S14), 来生成识别对象图像502(步骤S15)。其中,这里遍布识别对象图像500 (502)的水平方向的整个宽度附加该分割线L(L1~L6)。

另外,第2实施方式的步骤S17的详细内容与第1实施方式的步 骤S17的详细内容不同。

具体而言,云服务器90基于从外部终端50接收到的识别对象图 像502内的分割线L1~L6,将识别对象图像502内的行区域401~407 的每一个判定为相互不同的单位识别区域。而且,云服务器90针对识 别对象图像502实施OCR处理,生成在针对行区域401~407的文字识 别结果的末尾分别附加了分割码的文本数据551(图9)作为针对识别 对象图像502的OCR处理结果(步骤S17)。

其中,步骤S14以及S17以外的处理与上述第1实施方式同样地 进行。

根据这样的方式,能够获得与上述第1实施方式同样的效果。

<3.第3实施方式>

第3实施方式是第1实施方式的变形例。以下,以与第1实施方式 的不同点为中心来进行说明。

在该第3实施方式中,云服务器90基于OCR处理的处理对象图像 内的末尾识别图像(表示是单位识别区域的末尾的图像)来判定(识别) 单位识别区域。具体而言,当在处理对象图像内的某一行区域存在末尾 识别图像时,云服务器90将到该某一行区域为止的1个或者2个以上 的行区域与下一行区域以后的1个或者2个以上的行区域分别判定为单 位识别区域。而且,云服务器90生成在针对各单位识别区域的文字识 别结果的末尾分别附加了分割码的文本数据550。基于这样的判定基准, 云服务器90将处理对象图像内的文字区域划分为多个单位识别区域。

另外,在第3实施方式中,例示外部终端50执行在扫描图像200 内的多个行区域400各自的末尾附加末尾识别图像430(图13)的处理 作为“图像加工处理”的方式。外部终端50通过实施这样的“图像加 工处理”,来(有意图地)使云服务器90判定为该多个行区域400是相 互不同的单位识别区域,从云服务器90取得所希望的处理结果(在针 对各行区域400的文字识别结果的末尾分别附加了分割码的文本数据 550)。

在第3实施方式中,也与第1实施方式同样地分别进行图4的各 处理。

但是,第3实施方式的图像加工处理(步骤S14)的处理内容与 第1实施方式的图像加工处理(步骤S14)的处理内容不同。

具体而言,外部终端50(图像生成部66)将在扫描图像201内的 行区域401~407中最终行(行区域407)以外的行区域401~406各自 的末尾附加末尾识别图像430的处理作为“图像加工处理”并对扫描图 像201实施(步骤S14),来生成识别对象图像500(503)(步骤S15)。 这里,如图13所示,使换行码可视化后的图像(“¥n”)作为末尾识别 图像430(431~436)被附加在行区域401~406各自的末尾而生成识 别对象图像503。此外,这里将使换行码可视化后的图像(“¥n”)例示 为末尾识别图像430,但并不局限于此,末尾识别图像430例如也可以 是表示图形(三角形、四边形等)的图像(包括:图标等)。

另外,第3实施方式的步骤S17的详细内容与第1实施方式的步 骤S17的详细内容不同。

具体而言,云服务器90从该识别对象图像503内的文字区域提取 多个行区域((为了与原来的行区域401~407进行区别)也称为“新的 行区域”)。例如,云服务器90从该识别对象图像503内的文字区域提 取第一行的新的行区域。在该第一行的新的行区域中包括:原来的行区 域401以及末尾识别图像431。同样,云服务器90分别提取第2行以后 的新的行区域(分别包括:原来的各行区域402~407以及各末尾识别 图像432~436(最终行区域仅为行区域407))。而且,云服务器90识 别为在新的行区域各自的末尾(除了最终行之外)存在末尾识别图像 431~436,将被末尾识别图像431~436划分了的行区域(即原来的行 区域401~407)的每一个判定为相互不同的单位识别区域。然后,云服 务器90对识别对象图像503实施OCR处理,生成在针对行区域401~ 407的文字识别结果的末尾分别附加了分割码的文本数据551(图9)作 为针对识别对象图像503的OCR处理结果(步骤S17)。

其中,步骤S14以及S17以外的处理与上述第1实施方式同样地 进行。

根据这样的方式,能够获得与上述第1实施方式同样的效果。

<4.第4实施方式>

第4实施方式是第1实施方式的变形例。以下,以与第1实施方式 的不同点为中心来进行说明。

在该第4实施方式中,云服务器90基于OCR处理的处理对象图像 内的各行区域的文字颜色将各行区域判定(识别)为单位识别区域。具 体而言,在处理对象图像内的某一行区域(整体)的文字颜色与下一行 区域(整体)的文字颜色不同的情况下,云服务器90将处理对象图像 内的到该某一行区域为止的1个或者2个以上的行区域与下一行区域以 后的1个或者2个以上的行区域分别判定为单位识别区域。而且,云服 务器90生成在针对各单位识别区域的文字识别结果的末尾分别附加了 分割码的文本数据550。基于这样的判定基准,云服务器90将处理对象 图像内的文字区域划分为多个单位识别区域。

另外,在第4实施方式中,例示外部终端50执行将各行区域400 的文字颜色设定为与和各行区域400分别邻接的邻接行区域的文字颜色 不同的文字颜色的处理作为“图像加工处理”的方式。外部终端50通 过实施这样的“图像加工处理”,来(有意图地)使云服务器90判定为 该多个行区域400是相互不同的单位识别区域,从云服务器90取得所 希望的处理结果(在针对各行区域400的文字识别结果的末尾分别附加 了分割码的文本数据550)。

在第4实施方式中,也与第1实施方式同样地分别进行图4的各 处理。

但是,第4实施方式的图像加工处理(步骤S14)的处理内容与 第1实施方式的图像加工处理(步骤S14)的处理内容不同。

具体而言,外部终端50(图像生成部66)将扫描图像201内的行 区域401~407的文字颜色设定为与和行区域401~407分别邻接的行区 域(邻接行区域)的文字颜色不同的文字颜色的处理作为“图像加工处 理”来对扫描图像201实施(步骤S14),生成识别对象图像500(504) (步骤S15)。

例如,如图14所示,图像生成部66将第奇数行的行区域401、 403、405以及407的文字颜色设定为“黑色”,将第偶数行的行区域402、 404以及406的文字颜色设定为“红色”。这样,图像生成部66将行区 域401~407的文字颜色交替设定为不同的(两种颜色的)文字颜色来 生成识别对象图像504。换言之,图像生成部66生成将相邻接的行区域 的文字颜色设定为相互不同的文字颜色的识别对象图像504。

另外,第4实施方式的步骤S17的详细内容与第1实施方式的步 骤S17的详细内容不同。

具体而言,云服务器90对从外部终端50接收到的识别对象图像 504内的行区域401~407的文字颜色进行识别,基于该行区域401~407 的文字颜色与各邻接行区域不同,来将识别对象图像504内的行区域 401~407的每一个判定为相互不同的单位识别区域。而且,云服务器 90对识别对象图像504实施OCR处理,生成在针对行区域401~407的 文字识别结果的末尾分别附加了分割码的文本数据551(图9)作为针 对识别对象图像504的OCR处理结果(步骤S17)。

其中,步骤S14以及S17以外的处理与上述第1实施方式同样地 进行。

根据这样的方式,能够获得与上述第1实施方式同样的效果。

此外,在第4实施方式中,例示了将行区域401~407的文字颜色 交替设定为不同的(两种颜色的)文字颜色的方式,但并不局限于此, 也可以将行区域401~407的文字颜色分别设定为不同的文字颜色。

例如,也可以是行区域401的文字颜色被设定为“红色”,行区域 402的文字颜色被设定为“黑色”,行区域403的文字颜色被设定为“蓝 色”,行区域404的文字颜色被设定为“黄色”,行区域405的文字颜色 被设定为“绿色”,行区域406的文字颜色被设定为“淡蓝色”,行区域 407的文字颜色被设定为“黄绿色”。

<5.第5实施方式>

第5实施方式是第1实施方式的变形例。以下,以与第1实施方式 的不同点为中心来进行说明。

在该第5实施方式中,云服务器90基于OCR处理的处理对象图像 内的各行区域的行头位置(字符串排列方向(这里为水平方向)上的位 置)来将各行区域判定(识别)为单位识别区域。具体而言,在处理对 象图像内的某一行区域的行头位置与下一行区域的行头位置较大幅度 不同的(详细而言为偏离规定量的文字数(例如4个文字)以上)情况 下,云服务器90将处理对象图像内的到该某一行区域为止的1个或者2 个以上的行区域与下一行区域以后的1个或者2个以上的行区域分别判 定为单位识别区域。而且,云服务器90生成在针对各单位识别区域的 文字识别结果的末尾分别附加了分割码的文本数据550。基于这样的判 定基准,云服务器90将处理对象图像内的文字区域划分为多个单位识 别区域。

另外,在第5实施方式中,例示外部终端50执行将各行区域400 的行头位置分别设定在与和各行区域400分别邻接的邻接行区域的行头 位置不同的位置的处理作为“图像加工处理”的方式。外部终端50通 过实施这样的“图像加工处理”,来(有意图地)使云服务器90判定为 该多个行区域400是相互不同的单位识别区域,从云服务器90取得所 希望的处理结果(在针对各行区域400的文字识别结果的末尾分别附加 了分割码的文本数据550)。

在第5实施方式中,也与也与第1实施方式同样地分别进行图4 的各处理。

但是,第5实施方式的图像加工处理(步骤S14)的处理内容与 第1实施方式的图像加工处理(步骤S14)的处理内容不同。

具体而言,外部终端50(图像生成部66)将扫描图像201内的行 区域401~407的行头位置设定在与和行区域401~407分别邻接的行区 域(邻接行区域)的行头位置不同的位置的处理作为“图像加工处理” 来对扫描图像201实施(步骤S14),生成识别对象图像500(505)。

例如,图像生成部66如图15所示,将第奇数行的行区域401、 403、405以及407的行头位置(这里为左端的坐标位置)设定在识别对 象图像505内的比较左侧的位置。另外,图像生成部66将第偶数行的 行区域402、404以及406的行头位置分别设定在比较远离该行区域401、 403、405以及407的行头位置的位置(这里为从行区域401、403、405 以及407的各行头位置向右侧远离4个文字以上的位置)。这样,图像 生成部66生成将相邻接的行区域的行头位置设定在相互不同的位置的 识别对象图像505。

另外,第5实施方式的步骤S17的详细内容与第1实施方式的步 骤S17的详细内容不同。

具体而言,云服务器90基于从外部终端50接收到的识别对象图 像505内的行区域401~407的行头位置与各邻接行区域的行头位置不 同,来将识别对象图像505内的行区域401~407的每一个判定为相互 不同的单位识别区域。而且,云服务器90对识别对象图像505实施OCR 处理,生成在针对行区域401~407的文字识别结果的末尾分别附加了 分割码的文本数据551(图9)作为针对识别对象图像505的OCR处理 结果(步骤S17)。

其中,步骤S14以及S17以外的处理与上述第1实施方式同样地 进行。

根据这样的方式,能够获得与上述第1实施方式同样的效果。

<6.第6实施方式>

第6实施方式是第1实施方式的变形例。以下,以与第1实施方式 的不同点为中心来进行说明。

在该第6实施方式中,云服务器90基于OCR处理的处理对象图像 内的各行区域的文字尺寸来将各行区域判定(识别)为单位识别区域。 具体而言,在处理对象图像内的某一行区域(整体)的文字尺寸与下一 行区域(整体)的文字尺寸不同的(详细而言,差异规定磅以上的)情 况下,云服务器90将处理对象图像内的到该某一行区域为止的1个或 者2个以上的行区域与下一行区域以后的1个或者2个以上的行区域分 别判定为单位识别区域。而且,云服务器90生成在针对各单位识别区 域的文字识别结果的末尾分别附加了分割码的文本数据550。基于这样 的判定基准,云服务器90将处理对象图像内的文字区域划分为多个单 位识别区域。

另外,在第6实施方式中,例示外部终端50执行将各行区域400 的文字尺寸设定为与和各行区域400分别邻接的邻接行区域的文字尺寸 不同的文字尺寸的处理作为“图像加工处理”的方式。外部终端50通 过实施这样的“图像加工处理”,(有意图地)使云服务器90判定为该 多个行区域400是相互不同的单位识别区域,从云服务器90取得所希 望的处理结果(在针对各行区域400的文字识别结果的末尾分别附加了 分割码的文本数据550)。

在第6实施方式中,也与第1实施方式同样地分别进行图4的各 处理。

但是,第6实施方式的图像加工处理(步骤S14)的处理内容与 第1实施方式的图像加工处理(步骤S14)的处理内容不同。

具体而言,外部终端50(图像生成部66)将扫描图像201内的行 区域401~407的文字尺寸设定为与和行区域401~407分别邻接的行区 域(邻接行区域)的文字尺寸不同的文字尺寸的处理作为“图像加工处 理”来对扫描图像201实施(步骤S14),生成识别对象图像500(506) (步骤S15)。

例如,图像生成部66如图16所示,将第奇数行的行区域401、 403、405以及407的文字尺寸设定为比较大的文字尺寸(例如32磅)。 另外,图像生成部66将第偶数行的行区域402、404以及406的文字尺 寸设定为比该401、403、405以及407较小的文字尺寸(例如16磅)。 这样,图像生成部66生成将相邻接的行区域的文字尺寸设定为相互不 同的文字尺寸的识别对象图像506。

另外,第6实施方式的步骤S17的详细内容与第1实施方式的步 骤S17的详细内容不同。

具体而言,云服务器90对从外部终端50接收到的识别对象图像 506内的行区域401~407的文字尺寸进行识别,基于该行区域401~407 的文字尺寸与各邻接行区域的文字尺寸不同,来将识别对象图像506内 的行区域401~407的每一个判定为相互不同的单位识别区域。而且, 云服务器90对识别对象图像506实施OCR处理,生成在针对行区域 401~407的文字识别结果的末尾分别附加了分割码的文本数据551(图 9)作为针对识别对象图像506的OCR处理结果(步骤S17)。

其中,步骤S14以及S17以外的处理与上述第1实施方式同样地 进行。

根据这样的方式,能够获得与上述第1实施方式同样的效果。

<7.第7实施方式>

在上述各实施方式中,例示了以由云服务器90在单位识别区域的判 定中使用的判定手法(例如,基于行区域间的分离间隔来判定单位识别 区域的手法)被外部终端50的程序的设计者等知晓为前提,对扫描图 像200实施与该判定手法对应的图像加工处理的方式。

在该第7实施方式中,例示在该判定手法不被外部终端50的程序 的设计者等知晓的情况(譬如外部终端50不知晓该判定手法的情况) 下,通过向云服务器90进行查询来获知该判定手法,对扫描图像200 实施与从云服务器90获知的判定手法对应的图像加工处理的方式。

图17是表示第7实施方式涉及的电子文件生成系统1中的动作例 的时序图。如图17所示,除了与图4的步骤S11~步骤S19的各处理同 样的处理之外,还在步骤S13与S14之间进行步骤S21以及S22的处理。

具体而言,外部终端50在步骤S11~S13的处理之后,在识别对 象图像500的生成之前向云服务器90查询由云服务器90在单位识别区 域的判定中使用的判定手法(步骤S21)。

云服务器90响应于来自外部终端50的该查询,将与该判定手法 相关的信息发送给外部终端50(步骤S22)。例如,当在云服务器90中 单位识别区域的判定所使用的判定手法(单位识别区域的判定基准)是 基于分割线来判定单位识别区域的手法(参照第2实施方式)时,云服 务器90将该信息发送给外部终端50。

外部终端50若从云服务器90接收到与该判定手法相关的信息, 则对扫描图像200实施与该判定手法对应的图像加工处理(步骤S14), 生成识别对象图像500(步骤S15)。

例如,外部终端50(文件生成部67)若知晓在云服务器90中基 于分割线来判定单位识别区域这一信息,则实施对扫描图像200内的多 个行区域400的相互间的行间区域分别附加分割线L的处理作为图像加 工处理(步骤S14),来生成识别对象图像500(步骤S15)(还参照图 12)。

其中,步骤S16以后的处理与上述各实施方式同样地进行。

根据这样的方式,由于即使在不知晓由云服务器90在单位识别区 域的判定中使用的判定手法的情况下,外部终端50通过向云服务器90 进行查询也能够获知该判定手法,所以能够对扫描图像200实施与该判 定手法对应的适当的图像加工处理。

另外,例如即使在存在多个云服务器90、且各云服务器90分别 采用不同的判定手法的情况下,外部终端50通过查询由各云服务器90 采用的判定手法,也能够知晓各自的判定手法。因此,能够对扫描图像 200实施与各云服务器90的各判定手法对应的适当的图像加工处理。

<8.第8实施方式>

在第7实施方式中,例示了当外部终端50不知晓由云服务器90在 单位识别区域的判定中使用的判定手法时,通过向云服务器90进行查 询来获知该判定手法,并实施与该判定手法对应的图像加工处理的方 式。

在该第8实施方式中,当外部终端50不知晓该判定手法时,生成 分别被实施了相互不同的多个图像加工处理的多个测试图像,并在云服 务器90中针对该测试图像分别执行OCR处理。而且,基于各OCR处理 结果来确定(推断)该判定手法,并实施与所确定的判定手法对应的图 像加工处理(最适加工处理)。

图18是表示第8实施方式涉及的电子文件生成系统1中的动作例 的时序图。如图18所示,除了与图4的步骤S11~步骤S19的各处理同 样的处理之外,还在步骤S13与S14(S14A)之间分别进行步骤S31~ S34的处理。

具体而言,在步骤S11~S13的处理之后,提取部64从扫描图像 201提取行区域401~407中的一部分(2个以上)的行区域(这里为包 括:3个行区域401~403的部分251)(参照图19)。更详细而言,由 提取部64提取行区域401~407中的3个行区域401~403并由图像生 成部66生成部分图像(基于部分251的图像)。另外,在提取该部分251 时,图像生成部66检测部分251(一部分的行区域401~403)内的行 区域的个数(行区域数)。

而且,图像生成部66对于该部分(部分图像)251分别实施相互 不同的多个(这里为3个)图像加工处理(701~703等)而生成相互不 同的多个测试图像(531~533等)(步骤S31)。具体而言,图像生成部 66对于部分251(行区域401~403)实施图像加工处理701(将行区域 的相互间的分离间隔分别设定为最大高度H以上的大小H10(行区域401 的高度H1以上的大小H11(=H1+ΔH))的处理)来生成测试图像531 (图20)。另外,图像生成部66对于部分251实施图像加工处理702(对 行区域的相互间的行间区域分别附加分割线L(L1、L2)的处理)来生 成测试图像532(图21)。并且,图像生成部66对于部分251实施图像 加工处理703(在各行区域的末尾分别附加末尾识别图像430(431、432) 的处理)来生成测试图像533(图22)。而且,发送部54a将该多个测 试图像531~533发送给云服务器90(步骤S31)。

云服务器90若从外部终端50接收到该多个测试图像531~533, 则针对各测试图像531~533分别执行OCR处理,生成多个测试结果(OCR 处理结果(文本数据))570(571~573)(图23)(步骤S32)。而且, 云服务器90将该多个测试结果571~573发送给外部终端50(步骤 S33)。

外部终端50若从云服务器90接收到该多个测试结果571~573, 则决定最适加工处理(下述)(步骤S34)。

具体而言,外部终端50(图像生成部66)基于测试结果571~573 的每一个所含的分割码(换行码),来检测该测试结果571~573的每一 个所含的字符串数据(文字识别结果)的个数(字符串数据数)。如图 23所示,针对被实施了图像加工处理701的测试图像531的测试结果 (OCR处理结果)571所含的分割码的个数为“3”,字符串数据数(字 符串数据461~463的个数)为“3”。另外,针对被实施了图像加工处 理702的测试图像532的测试结果572所含的分割码的个数为“1”,字 符串数据数(字符串数据471的个数)为“1”。并且,针对被实施了图 像加工处理703的测试图像533的测试结果573所含的分割码的个数为 “1”,字符串数据数(字符串数据481的个数)为“1”。

而且,图像生成部66针对多个测试结果571~573的每一个求出 其字符串数据数与一部分的行区域(部分251(行区域401~403))的 个数(行区域数)之差(个数差)。若对多个测试结果571~573的每一 个求出了该个数差,则图像生成部66求出多个测试结果571~573中的 该个数差最小的测试结果作为最佳测试结果。这里,各测试图像531~ 533的每一个所含的一部分的行区域(部分251所含的行区域401~403) 的行区域数为“3”,测试结果571~573中的其字符串数据数(换言之 分割码的个数)与该行区域数“3”之差(个数差)最小的测试结果是 测试结果571。该测试结果571被决定为最佳测试结果。

若求出了最佳测试结果,则图像生成部66将多个图像加工处理 701~703中的与该最佳测试结果571对应的图像加工处理(这里为图像 加工处理701)决定为“最适加工处理”(参照图23)。

这样,在外部终端50不知晓由云服务器90在单位识别区域的判 定中使用的判定手法的情况下,生成被分别实施了相互不同的多个图像 加工处理701~703的相互不同的多个测试图像531~533。而且,基于 针对该测试图像531~533的多个OCR处理结果(测试结果)571~573 来决定最适加工处理。换言之,外部终端50通过使云服务器90进行针 对分别被实施了相互不同的多个图像加工处理的相互不同的多个测试 图像531~533的OCR处理,来确定(推断)在云服务器90中单位识别 区域的判定所采用的判定手法。

若决定了最适加工处理(步骤S44),则提取部64从扫描图像201 提取扫描图像201内的行区域401~407中的除了行区域401~403之外 的剩余的行区域404~407(部分252)(图19)。更详细而言,由提取部 64提取行区域401~407中的该剩余的行区域404~407并由图像生成 部66生成部分图像(基于部分252的图像)。而且,图像生成部66对 于该部分(部分图像)252实施最适加工处理(图像加工处理701)(步 骤S14A),来生成识别对象图像541(图24)(步骤S15)。在识别对象 图像541中,通过该最适加工处理,使得行区域404~407的相互间的 分离间隔分别被设定为行区域404~407中最高的行区域的高度(这里 为行区域404的高度H4)以上的大小H14(=H4+ΔH),来配置各行区 域404~407。

而且,该识别对象图像541被从外部终端50向云服务器90发送 (步骤S16),在云服务器90中执行OCR处理而生成文本数据581(与 剩余的行区域404~407相关的文本数据)(图25)(步骤S17)。

若从云服务器90接收到该文本数据581(步骤S18),则外部终端 50(文件生成部67)基于最佳测试结果571(图23)所含的分割码和文 本数据581(图25)所含的分割码,将由该最佳测试结果571与文本数 据581构成的数据划分为多个字符串数据。

具体而言,文件生成部67基于3个分割码将最佳测试结果571(与 行区域401~403相关的OCR处理结果)划分为3个字符串数据461~ 463(图23)。另外,文件生成部67基于4个分割码将文本数据581(与 行区域404~407相关的OCR处理结果)划分为4个字符串数据454~ 457(图25)。

而且,文件生成部67决定各行区域401~407与各字符串数据 461~463以及454~457的对应关系,在与各字符串数据461~463以 及454~457对应的各行区域401~407分别配置该各字符串数据461~ 463以及454~457来生成电子文件600(601)。

根据这样的方式,由于即使在不知晓由云服务器90在单位识别区 域的判定中使用的判定手法的情况下,外部终端50也能够使用被实施 了相互不同的多个图像加工处理的相互不同的多个测试图像来确定该 判定手法,所以能够对扫描图像200实施与所确定的判定手法对应的(适 当的)图像加工处理。

此外,在第8实施方式中,例示了从扫描图像201提取部分251 (行区域401~403),关于该部分251分别实施相互不同的多个图像加 工处理的方式,但并不限定于此。

例如,也可以对与扫描图像200(201)不同的样本图像(由2个 以上的行区域构成的图像)分别实施相互不同的多个图像加工处理。

具体而言,外部终端50(图像生成部66)从储存部55提取样本 图像,并针对该样本图像分别实施相互不同的多个图像加工处理来生成 相互不同的多个测试图像530(步骤S31)。另外,在提取该样本图像时, 图像生成部66检测样本图像内的行区域的个数(行区域数)。而且,外 部终端50将该多个测试图像530发送给云服务器90(步骤S31)。

云服务器90针对从外部终端50接收到的各测试图像530分别执 行OCR处理来生成多个测试结果(OCR处理结果)570(图23)(步骤 S32)。而且,云服务器90将该多个测试结果570发送给外部终端50(步 骤S33)。

外部终端50若从云服务器90接收到该多个测试结果570,则如 下述那样来决定最适加工处理(步骤S34)。

具体而言,外部终端50(图像生成部66)基于多个测试结果570 的每一个所含的分割码,来检测该多个测试结果的每一个所含的字符串 数据的个数(字符串数据数)。而且,图像生成部66针对多个测试结果 570的每一个求出其字符串数据数与样本图像所含的行区域的个数(行 区域数)之差(个数差)。若针对多个测试结果570的每一个求出了该 个数差,则图像生成部66求出多个测试结果570中该个数差最小的测 试结果作为最佳测试结果,将多个图像加工处理中的与该最佳测试结果 对应的图像加工处理决定为“最适加工处理”。

若决定了最适加工处理,则图像生成部66针对扫描图像201实施 该最适加工处理(步骤S14A),来生成识别对象图像500(步骤S15)。

另外,步骤S16以后的处理与上述第1~第7实施方式同样地进 行。

此外,这里例示了上述相互不同的多个测试图像530由图像生成 部66基于样本图像生成的方式,但该多个测试图像530也可以由外部 终端50预先生成并进行储存。另外,也可以预先检测出该多个测试图 像530内的行区域数。

<9.变形例等>

以上,对该发明的实施方式进行了说明,但该发明并不限定于上述 内容。

例如,在上述各实施方式中,例示了针对扫描图像201整体实施 图像加工处理来生成一个识别对象图像500的方式,但并不限定于此。 具体而言,也可以是扫描图像201内的行区域401~407被划分为多个 部分(例如2个部分(行区域401~403以及行区域404~407)),关于 该多个部分的每一个执行图像加工处理以后的处理(步骤S14~S19)。

另外,在上述各实施方式中,例示了针对扫描图像200(201)实 施单一的图像加工处理来生成识别对象图像500的方式,但并不局限于 此,也可以生成被实施了多个图像加工处理的识别对象图像500。

例如,外部终端50(图像生成部66)针对扫描图像201实施多个 (这里为2个)图像加工处理来生成识别对象图像500(511)。具体而 言,图像生成部66执行将扫描图像201内的多个行区域401~407的相 互间的分离间隔分别设定为该多个行区域401~407中最高的行区域的 高度(行区域401的高度H1)以上的大小H11(=H1+ΔH)的处理作 为第一个图像加工处理(参照第1实施方式)。而且,图像生成部66执 行对该多个行区域401~407的相互间的行间区域分别附加分割线L (L1~L6)的处理作为第2个图像加工处理(参照第2实施方式)。图 像生成部66针对扫描图像200实施这样的2个图像加工处理来生成识 别对象图像511(参照图26)。

该变形例涉及的方式在云服务器90中的单位识别区域的判定手 法不明(不确定)的情况下尤其有用。

即使在不确定云服务器90中的单位识别区域的判定手法的情况 下,如果对扫描图像200实施的多个图像加工处理中的任意一个是与该 判定手法对应的图像加工处理,则识别对象图像500内的各行区域 401~407也被云服务器90判定为相互不同的单位识别区域。通过被实 施多个图像加工处理,与被实施单一的图像加工处理的情况相比,识别 对象图像500内的各行区域401~407被云服务器90判定为相互不同的 单位识别区域的可能性变高。

另外,在上述各实施方式等中,作为电子文件生成装置例示了外 部终端50,但并不限定于此。例如,也可以是MFP10作为电子文件生成 装置来进行各种处理(例如图4的步骤S11~S16以及S19的处理等)。 即,可以不使用外部终端50而在MFP10中进行图像加工处理等,并且 在MFP10与云服务器90之间进行各种数据的收发动作等,由MFP10生 成电子文件600。

另外,在上述各实施方式等中,主要说明了各行区域由横向书写 的字符串(沿横向延伸的一行的字符串)构成的方式,但并不局限于此, 在各行区域由纵向书写的字符串(沿纵向延伸的一行(一列)字符串) 构成的情况下也能够应用上述思想。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号