首页> 中国专利> 基于图像中的文本进行图像显示的方法和系统

基于图像中的文本进行图像显示的方法和系统

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提供一种基于图像中的文本进行图像显示的方法和系统。本发明的图像显示方法，包括：文本提取步骤，提取待显示图像中的文本区域；文本含量值计算步骤，计算所述图像中文本的含量值；比较步骤，将所计算的含量值与预定阈值相比较；显示步骤，如果所述含量值大于所述预定阈值，则按该图像的真实大小来显示该图像。实现以符合用户浏览目的的方式向用户显示图像，同时避免计算机系统的不必要的负荷。

著录项

公开/公告号CN101419661A

专利类型发明专利
公开/公告日2009-04-29

原文格式PDF
申请/专利权人国际商业机器公司;
展开▼

申请/专利号CN200710180297.4
发明设计人卡里·贝茨;涂波;
展开▼

申请日2007-10-26
分类号G06K9/00;G06K9/20;G06T3/40;
代理机构北京市柳沈律师事务所;
代理人黄小临
地址美国纽约阿芒克
入库时间 2023-12-17 21:49:12

法律信息

法律状态公告日

法律状态信息

法律状态
2011-08-24

授权

授权
2009-06-24

实质审查的生效

实质审查的生效
2009-04-29

公开

公开

说明书

技术领域

本发明涉及一种基于图像中的文本进行图像显示的方法和系统，更具体地说，涉及一种能够自动确定按图像的真实大小来显示该图像还是把图像缩小以适应屏幕的方式来显示该图像的基于图像中的文本进行图像显示的方法和系统。

背景技术

随着计算机和网络等信息传播技术的发展，图像作为一种直观的信息表现方式，在计算机及网络领域中变得越来越普及。图像所表现的信息极为丰富，包括人像、风景图片、示意图、地图等等，甚至文字也能够以图像的格式来表现，而且，同一图像中所包含的信息种类也不是单一的，例如，以风光为主的图像中还包含文字、人像的背景为风景等，典型的情况为地图，是示意标记和文字的结合。对于各种各样的图像，计算机及网络用户对其需求的侧重点并不相同，例如，对于人像和风景图片，用户一般侧重于首先从整体上把握，而对于以文字为主要信息表现手段的图像，用户一般侧重于把握其中的细节，要达到其中主要文字能够识别的程度，该图像才是有意义的。然而，现有的计算机及网络并没有针对用户对于不同类型的图像的需求而采取有针对性的图像显示方式，从而造成图像的显示方式并不一定能够恰好符合用户的要求。

在较早期的图像显示方式中，图像以其真实大小显示，例如ACDSystems公司的ACDSee(注册商标)图像浏览管理软件。在其早期版本例如2.4中，在图像大于显示屏幕的情况下，用户一般先看到图像的局部，如果用户需要首先从整体上把握图像，则还需要把显示方式切换到以适合屏幕的大小显示，一方面需要用户的操作，另一方面增加用户的等待时间。

目前，在待显示图像大于显示屏幕的情况下，Microsoft公司的InternetExplorer(注册商标)浏览器采用将图像缩小到适合显示屏幕的大小然后在显示屏幕显示的方式，从而用户能够首先从整体上把握图像。在图像主要表现人像或风景的情况下，这种显示方式能够比较好地满足用户的要求。然而，在图像包含大量文本并主要表现其中的文字信息，或图像本身即为文本文档的图像的情况下，这样的缩小显示对于用户通常是没有价值的，因为用户通常无法识别图像中的文字。在这种情况下，用户必需在图像上移动鼠标，寻找并点击图像扩大图标，等待将图像扩大至其真实大小。一方面需要用户的操作，另一方面增加用户的等待时间。

总之，在现有的图像显示的技术中，无论是按图像的真实大小来显示该图像的方式，还是把图像缩小来以适应屏幕的大小显示该图像的方式，均有相当大的可能不能够满足用户的要求，造成一方面需要用户的操作，另一方面增加用户的等待显示的时间。因此需要一种能够自动确定按图像的真实大小来显示该图像还是把图像缩小以适应屏幕的方式来显示该图像的方案，目前的光学字符识别技术为实现此目的提供了可能性。

光学字符识别(Optical Character Recognition，OCR)技术，是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息，再利用文字识别技术将图像信息转化为可以使用的格式的计算机输入技术。可应用于银行票据、大量文字资料、档案卷宗、文案的录入和处理领域。利用OCR技术，可自动识别印刷体汉字、字母、数字，可识别手写体汉字、手写体字母、数字及多种手写符号。OCR技术还具有版面自动分析功能，能够自动对扫描的版面进行分析，把应识别的文本区域划分出来，之后进行识别。

光学字符识别包括如下的关键模块：图像输入、图像前处理、文字特征抽取、对比数据库、和对比识别。

影象输入：待经过OCR处理的对象透过光学仪器，诸如图像扫描仪、传真机或任何摄影器材，将图像传入计算机。随着科技的进步，扫描仪等输入装置已经制作得越来越精致，轻薄短小且品质高，扫描仪的分辨率使图像更清晰，增进OCR处理的效率。

影象前处理：包括从获取黑白二值化图像、或灰阶、彩色的图像到分离出各个文字图像的过程。涉及图像正规化、去除噪声、图像矫正等图像处理，及图文分析、文字行与字分离(即先以行为单位来分离出文字行，再针对各个文字行分离出文字行中的文字)等文件前处理。在图像处理方面，在理论和实际技术方面都已达到成熟阶段，因此在市面上或网络资源中有不少可用的链接库。在文件前处理方面，对于图像，需要先将图片、表格及文本区域相分离，甚至可以将文章的编排方向、文章的题纲及内容主体区域分开，而文字的大小及文字的字体也可以如原始文件一样地判断出来。

文字特征抽取：在识别率方面，特征抽取操作，诸如用何种特征、如何抽取等等，直接影响识别的效果。特征可以大致分为两类：一类是统计的特征，诸如文本区域内的黑白点数比；另一类是结构的特征，例如，文字图像细线化后，所取得的文字的笔划端点、交叉点的数量及位置、或笔划段。

对比数据库：其中存储标准、被视为正确的文字信息，当抽取输入文字的特征之后，无论是用统计还是用结构的特征，均需要对比数据库来进行对比，对比数据库的内容包含所有欲识别的文字字集、以及根据与对输入文字采用的特征抽取方法相同的特征抽取方法所获取的特征群组。

对比识别：根据不同的特征特性，选用不同的数学距离函数，通常采用的对比方法诸如欧式空间的对比方法、松弛(Relaxation)对比方法、动态程序(Dynamic Programming，DP)对比方法、以及类神经网络的数据库建立及对比、HMM(Hidden Markov Model(隐藏马尔可夫模型))等等。为了使识别的结果更稳定，还提出所谓的专家系统(Experts System)，其利用各种特征对比方法的相异互补性，提高识别结果的可信度。

此外，现有技术已有了多种计算图像总面积以及一个文字的面积的方法。其中，计算图像总面积可以采用多种方法，对于规则图像，可以通过图像库函数返回图像的长度和宽度，即可以得到图像总面积，对于具有复杂边缘轮廓的图像可以采用区域分割法，将图像分割成若干小块，分别求出每块的面积，再求和。针对一个文字，可以采用多种方法获取其大小，也可以获取其边距，包括上下边距和左右边距。边距大小可以用像素值表示。假设某个字是8号字，假设其大小为80×80像素并且左右上下边距均为5个像素，那么该文字所占面积是85×85像素。

美国专利申请公开US 2007/0104366 A1号公开了一种对图像中的文本区域进行抽取和重新排序的方案，用于向用户呈现以图像格式存储的文本。在该方案中，如果图像包含一个或多个文本区域，并且图像中的各个文本区域都有明确的边界，则可以利用OCR技术把图像中的各个文本区域抽取出来分别形成子图像。然后，按照预先设置的顺序，诸如文字阅读顺序，把各个子图像重新排序并向用户显示，便于用户阅读。然而，该方案并不涉及如何决定按图像的真实大小来显示该图像还是把图像缩小以适应屏幕的方式来显示该图像的问题。

美国专利申请公开US 2002/0120653 A1号公开了一种获取图像中文本信息以便于用户浏览网页的方案。在用户浏览的图像中包含文本区域的情况下，利用过滤器识别图像中的文本区域，利用OCR技术识别并提取出文本区域中的文字，然后放大文字以显示。该方案假定图像中的文字比较小，不方便用户阅读，因此提取图像中的文字并放大。因而，该方案不涉及对于是否应该将图像调整为显示屏幕大小来显示的判断。实践中的情况通常是，真实大小的图像中的文字大小适合于用户阅读，但是由于浏览器自动缩小了图像的大小，导致用户无法阅读图像中的文字，因而不需要盲目一概地放大图像中的文字。因此，在很大程度上，该方案造成计算机系统资源的无谓浪费。特别是，对于文本区域和图形区域之间存在紧密联系的图像，诸如地图，如果将地图图像中的表示地名和图例的文本提取出来单独显示，那么对于用户而言没有意义。

因此，现有的采用OCR技术处理文本图像的方案均未能提供一种能够自动确定是否应将图像缩小至显示屏幕的大小来进行显示的技术，以致造成用户浏览的不便、以及计算机系统的不必要的负荷。

发明内容

本发明针对现有技术中存在的上述缺陷而提出，本发明要解决的技术问题是提供一种基于图像中的文本进行图像显示的方法和系统，目的是以符合用户需要的方式向用户显示图像，以方便用户浏览，并避免计算机系统的不必要的负荷。

根据本发明的一个方面，提供一种基于图像中的文本进行图像显示的方法，包括：文本提取步骤，提取待显示图像中的文本区域；文本含量值计算步骤，计算所述图像中文本的含量值；比较步骤，将所计算的含量值与预定阈值相比较；显示步骤，如果所述含量值大于所述预定阈值，则按该图像的真实大小来显示该图像。

根据本发明的另一个方面，提供一种基于图像中的文本进行图像显示的系统，包括：文本提取器，提取待显示图像中的文本区域；文本含量值计算器，计算所述图像中文本的含量值；比较器，将所计算的含量值与预定阈值相比较；显示器，如果所述含量值大于所述预定阈值，则按该图像的真实大小来显示该图像。

按照本发明，在当前电子地图在计算机及网络资源中越来越普遍的情况下，以及越来越多的组织和个人利用数字照相机拍摄文件来保存文件的情况下，通过自动地计算图像中文本含量值，判断按图像的真实大小来显示该图像，还是把图像缩小来以适应屏幕的方式显示该图像，能够节省时间和用户操作，消除用户试图阅读过小的图像而造成的错误，提高浏览器的总体可用性。

附图说明

通过下面结合附图进行的详细描述，可以理解本发明所选择的实施例及其获得的许多的目的、特征和优点，其中：

图1是示出应用本发明的图像显示方法的总体流程图；

图2是示出一种计算图像中文本的含量值的方法的流程图；

图3是示出应用本发明的图像显示系统的总体框图；

图4是示出一种文本含量值计算装置的框图；

图5示出文本含量值高的图像的一个示例；

图6示出文本含量值低的图像的一个示例；以及

图7示出文本含量值高的地图图像的一个示例。

具体实施方式

下面参照附图详细说明本发明的具体实施例。

图1是示出应用本发明的图像显示方法的总体流程图。首先，在步骤S101，针对待显示的图像，提取其中的文本区域。此步骤可以通过使用光学字符识别(OCR)技术来实现，但是显然，能够从图像中判断并区分出文本区域的任何技术均可以应用于该步骤的处理。然后，在步骤S102，计算该图像中文本的含量值，并在步骤S103将所计算的含量值与预定阈值相比较。最后，在步骤S104，如果所计算的含量值大于预定阈值，则认为该图像是文本含量值高的图像，按该图像的真实大小来显示该图像。

应用图1所示的方法，对于如图5所示的图像，被判断为文本含量值高，从而按该图像的真实大小来显示，对于如图6所示的图像，被判断为文本含量值低，从而将其缩小至显示屏幕的大小来显示，对于如图7所示的地图图像，被判断为文本含量值高，从而按该地图图像的真实大小来显示。

下面详细说明计算图像中文本的含量值以及设置阈值的具体方法。

可以根据需要构想出一些考虑因素作为指标，诸如文本的拼写、语法，如果拼写语法错误过多，则体现出该文本的可读性不强，应降低图像中文本的含量值。还可以将图像中文本区域的数目作为指标，例如，对于地图，其中的文本分散，因此，尽管图像中文本总数量不是很高，但如果图像中文本区域的数目较多，则应提高图像中文本的含量值。还可以考虑所提取的文本区域中的文字的平均字体大小的因素，将其作为指标，如果所提取的文本区域中的文字的平均字体大小较大，则其对于按真实大小显示的要求会降低，应降低图像中文本的含量值。此外，还可以考虑文本区域的面积占图像面积的百分比的指标，如果该百分比高，则应提高图像中文本的含量值。

本领域技术人员应该理解，以上的指标并非穷尽计算图像中文本的含量值时所应考虑的所有因素，另一方面，上述指标显然是相互独立的，因此可以在设计时或由用户在使用时任意地选择采用。

关于对所选取采用的各个指标的评分方式，便于与阈值相比较，可以采用归一化的方法，另外，可以令所有分值均为正值，把所选用的指标的得分值相加，除以所选用的指标的满分之和，得到该图像中文本的含量值。如公式(1)所示：

$\frac{N 1 + N 2 + \cdot \cdot \cdot + Nk}{M 1 + M 2 + \cdot \cdot \cdot + Mk} = Q - - - (1)$

其中，选用k个指标，N1为第1个指标的分值，M1为第1个指标的满分，N2为第2个指标的分值，M2为第2个指标的满分，Nk为第k个指标的分值，Mk为第k个指标的满分，Q为图像中文本的含量值。显然，Q为[0，1]的归一化值。

显然，也可以不采用归一化值的方式，即把各个指标的得分相加作为图像中文本的含量值Q。也可以考虑部分或全部指标采用负数值，图像中文本的含量值也可以为负值。本领域技术人员应当理解，只要适当体现出所选用的指标的作用，评分体系可以设计为各种方式。

各个指标分别的评分方式可以通过对大量的文本图像进行统计计算而得出。例如，对于拼写指标，可以假定总分为100，出现一处拼写错误则减1分，最低至0；对于语法指标，可以假定总分为100，出现一处语法错误则减2分，最低至0；对于文本区域的数目指标，可以假定总分为100，有一处文本区域则得1分，最高100；对于平均字体大小的指标，可以假定总分为100，平均字体大小从72号(及以上)至5号(及以下)，或者从初号(及以下)至八号(及以上)，得分逐渐从0至100；对于文本区域的面积占图像面积的百分比的指标，可以假定总分为100，百分数即为得分。

显然，上述评分方法可以根据根据设计需要或用户选择而调整，例如总分可以是任意分数，甚至负数。各个指标的评分体系也可以调整，例如出现一处拼写错误则减2分，出现一处语法错误则减5分，有一处文本区域得2.5分。关于平均字体大小的评分，也可以将28号字以上的情况全部定为0分，字号与得分的关系可以是线性的，也可以是单调的任何其它函数关系。关于文本区域的面积占图像面积的百分比的评分，百分比与得分的关系也可以是单调的任何其它函数关系。

另外，为了体现各个指标之间重要性的不同，可以将各个指标的总分定为不同，例如，在正常的指标满分为100的情况下，如果认为平均字体大小的指标较为重要，可以将其总分定为150分，如果认为文本区域的数目的指标不很重要，可以将其总分定为50分。或者，各个指标之间重要性的不同可以通过为各个指标设置权重来表现。假定指标1至k的权重分别为W1至W5，则图像中文本的含量值的计算方法可以如公式(2)所示。

$\frac{W 1 \times N 1 + W 2 \times N 2 + \cdot \cdot \cdot + Wk \times Nk}{W 1 \times M 1 + W 2 \times M 2 + \cdot \cdot \cdot + Wk \times Mk} = Q - - - (2)$

可以通过现有的拼写检查器和/或语法检查器来检查所提取文本区域中文本的拼写和/或语法，例如Microsoft公司的字处理软件Word及邮件收发软件Outlook即采用了检查文本的拼写和/或语法的技术。可以通过计数器来计数文本中拼写和/或语法发生错误的个数。对于检查到拼写和/或语法错误的文本，可以降低相应指标的得分，在还选用了其它指标的情况下，还可以选择采用排除发生错误的文本的处理方法，也就是在其它指标的评分中，不再考虑该发生拼写和/或语法错误的文本区域。

可以在识别和提取图像中的文本区域(步骤S101)的同时，通过计数器来计数所提取的文本区域的数目，从而获取图像中的文本区域的数目。但是显然，获取图像中的文本区域的数目的操作也可以在提取图像中的文本区域之后，计算图像中文本含量值的步骤S102中进行。

计算所提取的文本区域中的文字的平均字体大小的操作可以通过下述的两种方法来进行。

一种方法是，利用OCR技术逐个返回每个文字的字体大小，把每个文字的字体大小相加，再除以图像中文字的总个数。如果图像中共有r个文字，分别为C1、C2、......、Cr，各个文字相应的字体大小分别为F1、F2、......、Fr，则该图像的平均字体大小AFS可以按照公式(3)求出：

$AFS = \frac{F 1 + F 2 + \cdot \cdot \cdot + Fr}{r} - - - (3)$

另一种方法是，利用OCR技术逐个返回每个文本区域的平均字体大小，如果图像中共有s个文本区域，各个文本区域分别为T1、T2、......、Ts，各个文本区域包含的文字个数分别为G1、G2、......、Gs，个文本区域的平均字体大小分别为AFS1、AFS2、......、AFSs，则该图像的平均字体大小AFS可以按照公式(4)求出：

$AFS = \frac{G 1 \times AFS 1 + G 2 \times AFS 2 + \cdot \cdot \cdot + Gs \times AFSs}{G 1 + G 2 + \cdot \cdot \cdot Gs} - - - (4)$

计算所提取的文本区域的面积并求出文本区域的面积占所述图像面积的百分比的操作可以通过下述的两种方法来进行。

一种方法是，利用OCR技术获取图像中每个文本区域的面积，如果图像中共有s个文本区域，各个文本区域分别为T1、T2、......、Ts，各个文本区域的面积分别为D1、D2、......、Ds，图像的总面积为H，则该图像的文本区域面积的百分比可以按照公式(5)求出：

$P = \frac{D 1 + D 2 + \cdot \cdot \cdot + Ds}{H} - - - (5)$

另一种方法是，利用OCR技术逐个返回每个文字的字体大小，将字体大小换算成该文字所占的面积，如果图像中共有r个文字，分别为C1、C2、......、Cr，各个文字所占的面积分别为E1、E2、......、Er，图像的总面积为P，则该图像的文本区域面积的百分比可以按照公式(6)求出：

$P = \frac{E 1 + E 2 + \cdot \cdot \cdot + Er}{H} - - - (6)$

在对海量的现有的文本图像进行上述公式(1)或公式(2)的计算，如果得到的图像中文本的含量值Q的范围在[Q1，Q2]，则可以选取将Q1定为阈值TH，即按图像的真实大小来显示该图像还是把图像缩小以适应屏幕的方式来显示该图像的标准，根据所计算的文本的含量值Q与阈值TH的比较结果，如果含量值Q大于阈值TH，则认为该图像的文本含量值高，按图像的真实大小来显示，如果含量值Q小于阈值TH，则认为该图像的文本含量值低，把图像缩小以适应屏幕的方式来显示。显然，阈值的确定同样可以根据设计需要或用户选择来进行，例如设置为Q2或介于Q1和Q2之间的任意数、甚至小于Q1或大于Q2的数，只要所设置的阈值TH符合具体用户对于图像的显示方式的要求。

阈值TH可以设置为一个阈值，也可以提供为不同程度的多个阈值供用户在使用中选择，或者可以由用户自由设置。

图2示出了在选择采用拼写和/或语法指标、文本区域数目指标、平均字体大小指标、和文本区域面积百分比指标的情况下的一种计算图像中文本的含量值的方法的流程图。

在步骤S201，检查所提取文本区域中文本的拼写和/或语法。如果检查到拼写和/或语法错误，则降低此项指标的得分。或者，也可以排除发生错误的文本区域，在随后的步骤中，不再考虑发生拼写和/或语法错误的文本区域。

在步骤S202，对所提取的文本区域的数目计数。

在步骤S203，计算所提取的文本区域中的文字的平均字体大小。可以采用如上述公式(3)或公式(4)所描述的方法。

在步骤S204，计算所提取的文本区域的面积并求出文本区域的面积占所述图像面积的百分比。可以采用如上述公式(5)或公式(6)所描述的方法。

在步骤S205，根据所检查的拼写和/或语法的情况、文本区域的数目、平均字体大小、和文本区域的面积占所述图像面积的百分比，而评出所述图像中文本的含量值。可以采用如上述公式(1)或公式(2)所描述的方法。假定拼写指标的得分为N1，总分为M1，权重为W1；语法指标得分为N2，总分为M2，权重为W2；文本区域的数目指标得分为N3，总分为M3，权重为W3；平均字体大小指标得分为N4，总分为M4，权重为W4；文本区域的面积所占百分比的指标得分为N5，总分为M5，权重为W5，则图像中文本的含量值Q可以按如下公式(7)求出：

$Q = \frac{W 1 \times N 1 + W 2 \times N 2 + W 3 \times N 3 + W 4 \times N 4 + W 5 \times N 5}{W 1 \times M 1 + W 2 \times M 2 + W 3 \times M 3 + W 4 \times M 4 + W 5 \times M 5} - - - (7)$

显然，在只选择检查拼写而不检查语法的情况下，上述公式(7)中的W2×N2项和W2×M2项应去除。类似地，在只选择检查语法而不检查拼写的情况下，上述公式(7)中的W1×N1项和W1×M1项应去除。

本领域技术人员可以理解，在图2示出的计算图像中文本的含量值的方法中，很显然，各个步骤不限于该图2所公开的具体的顺序和组合方式，其中的步骤S201～S204是相互独立的，根据设计需要以及用户的决定，可以个别地选择是否采用，并且选择采用的步骤之间的顺序也是可以任意调整的。

例如，可以只选用步骤S201，即检查所提取文本区域中文本的拼写和/或语法，然后基于所检查的拼写和/或语法的情况而评出图像中文本的含量值。在此情况下，图像中文本的含量值Q可以按如下公式(8)求出：

$Q = \frac{W 1 \times N 1 + W 2 \times N 2}{W 1 \times M 1 + W 2 \times M 2} - - - (8)$

例如，可以只选用步骤S202，即对所提取的文本区域的数目进行计数，然后基于图像中文本区域的数目而评出所述图像中文本的含量值。在此情况下，图像中文本的含量值Q可以按如下公式(9)求出：

$Q = \frac{W 3 \times N 3}{W 3 \times M 3} - - - (9)$

例如，可以只选用步骤S202、S203、和S204，即，对所提取的文本区域的数目进行计数，然后计算所提取的文本区域中的文字的平均字体大小，并计算所提取的文本区域的面积并求出文本区域的面积占图像面积的百分比，然后，根据文本区域的数目、平均字体大小、和文本区域的面积占图像面积的百分比，而评出所述图像中文本的含量值。在此情况下，图像中文本的含量值Q可以按如下公式(10)求出：

$Q = \frac{W 3 \times N 3 + W 4 \times N 4 + W 5 \times N 5}{W 3 \times M 3 + W 4 \times M 4 + W 5 \times M 5} - - - (10)$

或者，例如，可以只选用步骤S201和S202，即，检查所提取的文本区域中文本的拼写和/或语法，并对所提取的文本区域的数目计数，然后，基于所检查的拼写和/或语法的情况、和该文本区域数目，而评出图像中文本的含量值。在此情况下，图像中文本的含量值Q可以按如下公式(11)求出：

$Q = \frac{W 1 \times N 1 + W 2 \times N 2 + W 3 \times N 3}{W 1 \times M 1 + W 2 \times M 2 + W 3 \times M 3} - - - (11)$

其中，关于从各个指标的情况来获得该指标的得分的操作，既可以在如步骤S201～S204的获取各个指标的情况的步骤进行，也可以在如步骤S205的评出图像中文本的含量值的步骤中进行。

实际上，对于计算图像中文本含量值所选用的指标的组合方式不限于上述的例子。而且，还可以在本发明的基于图像中的文本进行图像显示的方法的执行过程中，检测用户是否发出关于按适合于显示屏幕大小的大小显示图像的指令，如果检测到用户发出按适合于显示屏幕大小的大小显示图像的指令，则按适合于显示屏幕大小的大小来缩小该图像并重新显示。

下面，说明本发明的基于图像中的文本进行图像显示的系统。

图3示出了应用本发明的图像显示系统的总体框图。文本提取器301针对待显示的图像，提取其中的文本区域。文本提取器301的上述操作可以通过使用光学字符识别(OCR)技术来实现，但是显然，能够从图像中判断并区分出文本区域的任何技术均可以应用于文本提取器301的处理。然后，文本含量值计算器302计算该图像中文本的含量值。文本含量值计算器302可以通过上述公式(1)或公式(2)来计算该图像中文本的含量值。然后，比较器303将所计算的含量值与预定阈值相比较。最后，如果所计算的含量值大于预定阈值，则显示器304把该图像作为文本含量值高的图像，按该图像的真实大小来显示。

本发明的文本含量值计算器302可以以上述的指标作为评价图像中文本含量值的指标，并以上述的评分体系来作为针对各个指标进行评分的体系。在本发明中，针对各个指标，分别设计器件来进行处理，获取该指标的情况。

图4示出了在选择采用拼写和/或语法指标、文本区域数目指标、平均字体大小指标、和文本区域面积百分比指标的情况下的一种计算图像中文本的含量值的文本含量值计算器302的组成框图。

检查器401检查所提取文本区域中文本的拼写和/或语法。如果检查到拼写和/或语法错误，则降低此项指标的得分。文本区域计数器402对所提取的文本区域的数目计数。

平均字体大小计算器403可以通过执行如上述公式(3)或公式(4)所描述的操作，来计算所提取的文本区域中的文字的平均字体大小。

文本区域比计算器404可以通过执行如上述公式(5)或公式(6)所描述的操作，来计算所提取的文本区域的面积并求出文本区域的面积占所述图像面积的百分比。

上述器件401～404的处理结果分别输出至评值器405，评值器405按照上述公式(7)来计算图像的文本含量值。

本领域技术人员应当理解，在图4示出的文本含量值计算装置中，很显然，各个组成器件不限于该图4所公开的具体的组合方式，其中的器件401～404可以是相互独立的，根据设计需要以及用户的决定，因而可以个别地选择是否采用。可以为每个器件401～404分别甚至一个选择器，从而在设计时或在用户使用时能够通过选择器来控制是否选用相应的器件。

关于从各个指标的情况来获得该指标的得分的处理，既可以在如器件401～404的获取各个指标的情况的器件进行，也可以在如评值器405的评出图像中文本的含量值的器件中进行。

在检查器401只检查拼写而不检查语法的情况下，上述公式(7)中的W2×N2项和W2×M2项应去除。类似地，在检查器401只检查语法而不检查拼写的情况下，上述公式(7)中的W1×N1项和W1×M1项应去除。

并且，文本含量值计算器302可以配置为，检查器401在检查到拼写和/或语法错误后，可以排除发生错误的文本区域，并将排除了发生错误的文本区域的文本输出至器件402～404，从而器件402～404不再考虑发生拼写和/或语法错误的文本区域。

例如，在器件401～404中，可以只选用检查器401，即，检查器401检查所提取文本区域中文本的拼写和/或语法，评值器405按照上述公式(8)，基于所检查的拼写和/或语法的情况而评出图像中文本的含量值。

例如，在器件401～404中，可以只选用文本区域计数器402，即，文本区域计数器402对所提取的文本区域的数目进行计数，评值器405按照上述公式(9)，基于图像中文本区域的数目而评出所述图像中文本的含量值。

例如，在器件401～404中，可以只选用文本区域计数器402、平均字体大小计算器403、和文本区域比计算器404，即，文本区域计数器402对所提取的文本区域的数目进行计数，平均字体大小计算器403计算所提取的文本区域中的文字的平均字体大小，文本区域比计算器404计算所提取的文本区域的面积并求出文本区域的面积占图像面积的百分比，然后，评值器405按照上述公式(10)，根据文本区域的数目、平均字体大小、和文本区域的面积占图像面积的百分比，而评出所述图像中文本的含量值。

例如，在器件401～404中，可以只选用检查器401和文本区域计数器402，即，检查器401检查所提取的文本区域中文本的拼写和/或语法，文本区域计数器402对所提取的文本区域的数目计数，然后，评值器405按照上述公式(11)，基于所检查的拼写和/或语法的情况、和文本区域的数目，而评出图像中文本的含量值。

实际上，对于计算图像中文本含量值所选用的指标的组合方式不限于上述的例子。而且，还可以在本发明的基于图像中的文本进行图像显示的系统中，另外设置检测器，用来检测用户是否发出关于按适合于显示屏幕大小的大小显示图像的指令，如果检测到用户发出按适合于显示屏幕大小的大小显示图像的指令，则由显示器按适合于显示屏幕大小的大小来缩小该图像并重新显示。

按照本发明，通过计算待显示图像中文本的含量值，自动判断按图像的真实大小来显示该图像，还是把图像缩小来以适应屏幕的方式显示该图像，一方面实现以符合用户浏览目的的方式向用户显示图像，同时避免计算机系统的不必要的负荷。

可以在应用本发明的基于图像中的文本进行图像显示的方法之前，先获取待显示图像的面积，类似地，本发明的基于图像中的文本进行图像显示的系统，也可以在执行处理前先获取待显示图像的面积，如果该图像面积大于显示屏幕面积以致于按真实大小无法同时在显示屏幕上显示图像整体，则判断是否应将图像缩小至显示屏幕的大小来进行显示。

另外，除了应用于判断是否应将图像缩小至显示屏幕的大小来进行显示之外，很显然，本发明还可以应用于从大量图像中搜索出文本图像，以及应用于从大量文本图像中搜索出拼写和/或语法错误比较多的文本图像。本发明能够实施于浏览器或浏览器插件中。

为了说明和描述，提出了上面的陈述。但并非想要穷尽或把本发明限制到所公开的详细形式。根据上面的说明，可以进行许多修改和变更。意图本发明的范围不由在此的详细描述限制，而由所附的权利要求来限定。上面地说明和示例地实施提供本发明的制造和构成使用的完全说明。由于在不脱离本发明的精神和范围的前提下，能够作出本发明的许多实施例，因此，本发明体现于所附的权利要求中。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于图像中的文本进行图像显示的方法和系统 [P] . 中国专利： CN101419661B . 2011.08.24
2. 对文本数据进行编码,以包含用在文本－语音(TTS)系统中的增强型语音数据的方法以及解码方法,TTS系统和包含所述TTS系统的移动电话 [P] . 中国专利： CN1522430A . 2004-08-18
3. Method and system for displaying image based on text in image [P] . 美国专利： US8442324B2 . 2013-05-14

机译：基于图像中文本的图像显示方法及系统
4. METHOD AND SYSTEM FOR DISPLAYING IMAGE BASED ON TEXT IN IMAGE [P] . 美国专利： US2009110287A1 . 2009-04-30

机译：基于图像中文本的图像显示方法及系统
5. Method and system for matching descriptive text for a multimedia content in a vendor's catalog with descriptive text for a multimedia content in media store's catalog [P] . 美国专利： US9418136B1 . 2016-08-16

机译：将供应商目录中多媒体内容的描述性文本与媒体商店目录中多媒体内容的描述性文本进行匹配的方法和系统