首页> 中国专利> 用于预测经过通过缩放以及质量控制参数的改变而转换的图像的文件大小的系统和方法

用于预测经过通过缩放以及质量控制参数的改变而转换的图像的文件大小的系统和方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

一种系统和方法，用于预测经过通过缩放以及至少一个质量控制参数的改变而转换的图像的文件大小，其中输入端接收(a)在转换之前的图像的文件大小，(b)在转换之前的关于所述图像的至少一个质量控制参数的信息，(c)在转换期间的关于应用于图像的至少一个质量控制参数的信息，和(d)在转换期间应用于图像的缩放因子。基于关于质量控制参数和缩放因子的接收信息计算相对文件大小预测。最后，根据所述转换之前的图像的文件大小和计算的相对文件大小预测来计算所述转换之后的图像的文件大小。

著录项

公开/公告号CN101842811A

专利类型发明专利
公开/公告日2010-09-22

原文格式PDF
申请/专利权人高等技术学校;
展开▼

申请/专利号CN200780101390.X
发明设计人 S·皮金;J-F·弗朗什;S·库隆布;
展开▼

申请日2007-11-02
分类号G06T9/00(20060101);G06T3/40(20060101);
代理机构11247 北京市中咨律师事务所;
代理人杨晓光;赵鹏华
地址加拿大魁北克省
入库时间 2023-12-18 00:44:04

法律信息

法律状态公告日

法律状态信息

法律状态
2012-05-23

授权

授权
2010-12-22

实质审查的生效 IPC(主分类):G06T9/00 申请日:20071102

实质审查的生效
2010-09-22

公开

公开

说明书

技术领域

概括地说，本发明涉及图像转码。更具体地，本发明关于一种系统和方法，用于预测经过通过缩放以及质量控制参数的改变而转换的图像的文件大小。

背景技术

如今，移动终端、电子设备、通信和多媒体应用的异构特征使得多媒体转码不可避免。例如，在新兴的多媒体消息服务(MMS)中，服务器端适配是必要的，以在目的移动终端不能够处理在其当前格式下的接收媒体时确保互通性。图像相关的互通性问题主要源自过高的分辨率或文件大小。由此，图像转码操作通常涉及图像缩放和文件大小的缩减。

尽管缩减图像的分辨率是已知的和确定性的问题，但是为了满足给定目标而有效缩减图像的压缩文件大小仍旧是一个挑战。例如，在有损耗的JPEG(联合图像专家组)格式中，用户典型地控制质量因子(QF)，其影响量化处理并因此影响压缩文件大小。当然，更高的QF导致更好的图像质量和更大的文件尺寸。然而，由于在建立QF和压缩文件大小之间的关系时必须还要考虑其他图像属性，所以在QF和压缩文件大小之间仍旧缺乏精确的关系。

用于图像的文件大小缩减的一个简单的转码方法可包括在可接受的容限内解码图像，并随后用不同QF反复地重新编码图像，直到满足给定目标大小。但是在功能上，这个方法在计算方面效率非常低，因此对于大量图像转发服务器来说是不可接受的。

多个研究已经致力于量化和文件大小之间的关系、或比特率。但是这些研究提供了有趣的结果，他们难以在如下提出的环境中实现：预测通过经过缩放以及QF值的改变而转换的JPEG图像文件大小，因为许多假设不满足。例如，大部分研究开始于原始、非人造的图像。同样，这些研究中的某些是在MPEG视频编码的环境中进行的，其使用比JPEG更简单的量化方案。更重要地，作为真实适配策略，这些研究忽略了图像的缩放。以下将讨论与提出的环境的这些区别的影响。

此外，提出有趣的方法来解决JPEG大小适配的特定问题(见例如于2001年5月15日授权给Ratnakar等的美国专利6,233,359B1，和J.Ridge的文章“Efficient transform-domain size and resolution reduction ofimages”，信号处理：图像通信，18(8)：621-639，2003年9月)。如J.Ridge的文件所述，美国专利6,233,359 B1的方法解决了比用户体验更高的复杂度，同样这个方法倾向于降低文件大小，从而呈现出两个主要缺点。尽管J.Ridge的方法提供了比美国专利6,233,359 B1更好的结果，但是这两个方法仍旧具有主要缺陷或限制，特别地，他们并没有将缩放看作文件大小缩减策略，从而需要进一步致力于和改进现有方法。

例如，现有算法首先需要收集某些图像统计。由此，不仅处理的复杂度增加，而且需要图像压缩工具的某种程度的重新工程化，而JPEG编码器/解码器软件必须成为专用的转码器。

其次，那些算法将图像的分辨率看作固定的，或在先前阶段独立改变，并且唯一地关注于文件大小缩减。然而，质量控制参数和缩放的改变的影响的研究看起来是必要的。当然，这将是有用的，以选择将满足终端限制的缩放和QF值的最佳组合。具体地，通常更佳的是与低质量的高分量图像相比具有更低分辨率的、高质量图像。

发明内容

更具体地，根据本发明，提供一种方法，用于预测经过通过缩放以及至少一个质量控制参数的改变而转换的图像的文件大小，包括：接收(a)在所述图像转换之前的图像的文件大小，(b)在所述图像转换之前的关于所述图像的至少一个质量控制参数的信息，(c)在所述图像转换期间的关于应用于图像的至少一个质量控制参数的信息，和(d)在所述图像转换期间应用于图像的缩放因子；基于关于质量控制参数和缩放因子的接收信息计算相对文件大小预测；以及计算在所述图像转换之后的图像的文件大小预测，其中根据所述图像转换之前的图像的文件大小和计算的相对文件大小预测来计算所述图像转换之后的图像的文件大小预测。

本发明还涉及一种系统，用于预测经过通过缩放以及至少一个质量控制参数的改变而转换的图像的文件大小，包括：输入端，用于接收(a)在所述图像转换之前的图像的文件大小，(b)在所述图像转换之前的关于所述图像的至少一个质量控制参数的信息，(c)在所述图像转换期间的关于应用于图像的至少一个质量控制参数的信息，和(d)在所述图像转换期间应用于图像的缩放因子；基于关于质量控制参数和缩放因子的接收信息计算相对文件大小预测；以及在计算所述图像转换之后的图像的文件大小预测，其中根据所述图像转换之前的图像的文件大小和计算的相对文件大小预测来计算所述图像转换之后的图像的文件大小预测。

在阅读仅参照附图通过实例给出的一下本发明的示例性实施例的非限制性描述，本发明的以上和其他目的、优点和特定将变得更加清楚。

附图说明

在附图中：

图1是根据本发明的第一非限制性示例性实施例的第一系统的示意性框图，其用于预测经过缩放以及质量控制参数的改变而转换的图像的文件大小；

图2是示出根据本发明的第一非限制性示例性实施例的第一方法(相应于图1的第一系统)的训练阶段的流程图，其用于预测经过缩放以及质量控制参数的改变而转换的图像的文件大小；

图3是根据本发明的第二非限制性示例性实施例的第二系统的示意性框图，其用于预测经过缩放以及质量控制参数的改变而转换的图像的文件大小；

图4是示出根据本发明的第二非限制性示例性实施例的第二方法(相应于图3的第二系统)的训练阶段的流程图，其用于预测经过缩放以及质量控制参数的改变而转换的图像的文件大小；

图5是示出估计量或其等效阵列的几何解释的视图；

图6是成簇的实例的视图；以及

图7a和7b是示出根据文件大小(字节)的0的百分比的视图。

具体实施方式

概括地说，根据本发明的非限制性示例性实施例的系统和方法将预测图像的文件大小，所述图像已经被压缩并经过缩放以及质量控制参数的改变而转换。

同样，尽管根据非限制性示例性实施例的系统和方法将预测经过缩放以及至少一个质量控制参数(在这种情况下为QF(质量因子))的改变而转换的JPEG图像的文件大小，但是应理解，相同的构思可应用于例如GIF(图形交换格式)的其他类型格式以及具有例如颜色数量、颜色深度、颜色分量采样结构(4:4:4，4:2:2，4:2:0等)、水平和垂直分辨率、子采样因子等的其他质量控制参数的其他图像格式。为了清楚和有助于保持说明简单，主要通过一个质量控制参数来说明本发明，但是可扩展到许多质量控制参数；以下将更详细地说明。

根据非限制性示例性实施例的系统和方法还将选择满足一定大小限制的缩放和QF的适当组合。此外，为了最小化处理复杂度，用于文件大小的预测的系统(以下称为文件大小的预测器)使用可从图像容易利用和易于访问的值。

然而，在进一步定义文件大小的预测器之前，将描述训练和测试图像库(corpus)的概念。

为了测试文件大小的预测器和/或文件大小预测方法，使用图像的库。可用的库由范本-在我们的实例中为图像-的集合构成，这代表要研究的集群。目前，典型的JPEG数据库没有普遍可用；因此，用户必须建立他/她自己的数据库或图像库。例如，可从因特网收集图像以形成图像库。当然，抓取器(crawler)可容易地跟踪从确保最新的流行网页开始的链接，并随后可抓取碰到的任何图像媒体。此外，可通过使用唯一标识符(例如由应用于整个文件的例如MD5(消息摘要5)的强哈希函数重命名文件来确保图像库中的图像的匿名化和唯一性。此外，可安全地忽略冲突。例如MD5的强哈希函数从文档计算数字签名，其可随后被可靠地用于识别已经被计算的文档。像MD5的超强哈希函数极度不可能对于两个不同文档生成相同的数字签名，由此能够实现检测同一文件的非常可靠的方法。

此外，将图像库分成两个随机的分离集：图像的训练集和图像的测试集。训练集包含用于优化预测模型和方法的图像，而测试集用于实际测试所优化的预测模型和方法。由于所述库呈现非常有限数目个范本，所以通过对于质量控制参数和缩放应用大量可能的转换来生成新范本，从而可构成具有大量和可用范本集群的模型。

现在将描述目前使用的图像文件大小预测系统和方法，例如i)多项式预测和ii)ρ域预测系统和方法。

i)多项式预测

多项式预测使用低阶多项式对预测进行公式化。如果对一维数据计算多项式拟合是一个简单的任务，那么对拟合增加多个变量将指数地增加需要计算的点数。当然，如果将Lin等的技术(文章“Rate control usingspline-interpolated R-D characteristics”，子标题，VCIP’96，第111-122页，1996年)概括为使用n个变量中的d阶多项式，则需要解(d+1)ⁿ个未知的(d+1)ⁿ个等式。对于这些(d+1)ⁿ个等式中的每个，需要估计曲线上的点。通过Lin等提出的方法，这意味着需要执行每个点的部分转码，从而导致无法接受的计算量。

此外，不清楚多项式的最佳阶d是什么(或甚至根本就是多项式)以及在预测中应该包括什么样的n个变量。至少应使用缩放和预期的输出质量因子QF_out来对预测公式化；在图像本身中输入质量因子QF_in是隐含的，因此当计算了(d+1)ⁿ个点时参与计算。因为这个过程在计算上是禁止的，所以决定不再深度研究这个行为。

应注意，QP(量化参数)和QF(质量因子)是反向相关的。高QP意味着更积极的量化，而高QF意味着更高的质量，因此意味着更不积极的量化。在例如用于标准H.263的方案中，QP与量化直接相关。然而，在JPEG中，QF通过两个连续步骤与量化相关：在第一步骤，使用分段转移函数；以及在第二步骤，使用量化矩阵。量化矩阵缩放DCT(离散余弦变换)系数，然后编码。应指出，在本说明书中，QF指的是JPEG质量因子，是独立JPEG组(IJG)可理解的。

ii)ρ域预测

在ρ域预测中，基于从量化得到的0的数目的估计来计算比特率的精确预测。

在ρ域预测中，假设i)图像没有被调整大小，ii)目标比特率很低，和iii)原始图像对于压缩器可用。在标准H.263的环境下，前2个假设i)和ii)可以有效。然而，假设在图像适配和转换的环境下原始图像对于压缩器可用(假设iii)不有效；如上所述，原始和初始图像通常对于转换引擎不可用。

ρ域预测使用标准H.263的更粗量化。JPEG使用可定制的量化矩阵，而标准H.263使用更简单的统一量化。量化矩阵所带来的额外复杂度使得ρ域预测的模型更加不易于JPEG适配。

图7a和7b示出根据ρ域预测的预测器在很低QF的区域内是线性。更具体地，0的数目随着比特率线性改变，但是仅在很低比特率处。然而，如果考虑大范围的比特率，则失去线性，如图7b所示。此外，对于使用JPEG的静态图像编码，很低的QF是不可接受的，因为这样将导致伪影和较差的感知图像质量。当最大化用户体验时，应该在满足文件大小限制的同时考虑最高可能的QF。

此外，ρ域预测在计算方面开销很大，并且假定不同范围的量化参数值。

不仅多项式预测和ρ域预测相当复杂，而且他们还呈现缺陷。第一，多项式预测和ρ域预测做出通常不抑制转码的假设，例如使用原始图像。第二，多项式预测和ρ域预测省略了用于缩减文件大小的缩放操作。因此，他们的估计不导致缩放和QF缩减的联合估计。ρ域预测假设，当发生缩减时，其发生在转码的文件大小预测之前，这不允许用户基于缩放和质量因子对于文件大小的适配策略进行公式化。理论上，多项式预测也可包括缩放，但是由于需要转码的数目随着使用的变量的数目指数增长，所以这个操作的计算成本较高。省略作为适配策略的缩放是主要缺陷，因为这样的目的是为了很好地最大化用户体验，将图像缩小并且通过更高的QF编码，而并非仅通过更低QF来重新压缩。因此，文件大小的预测器应该同样能够考虑缩放，以及QF改变。

此外，除了图像的宽度、高度、缩放和QF之外，还关注于获得不使用图像数据的文件大小的预测。此外，文件大小的预测器应该能够使用关于其他图像的信息，以对于与当前图像相关的预测公式化。因此，将有利地使用非参数的方法。

非参数的模型在内部参数的数目方面与参数的模型不同，前者通常具有更大的内部参数的数目，并且这些参数被松散地组织以实现结构的发现。相反，参数化模型使用固定的和少量参数，通过先前假设为每个分配非常特定的角色。

1.第一转换的图像文件大小的预测器

概括地说，根据本发明的第一非限制性示例性实施例的文件大小的预测器通过考虑图像的压缩文件大小来预测在与某个预测因子相乘的图像的转换之前经过缩放以及质量因子的改变而转换的图像的文件大小，以下称为相对文件大小的预测。

现在转到图1，将描述根据本发明的第一非限制性示例性实施例的文件大小的预测器10。文件大小的预测器10通常用在转码引擎(未示出)中。然而，将文件大小的预测器10用在除了转换引擎之外的设备中(例如编码器和解码器等中)也在本发明的范围内。

在转码中，典型地使用例如媒体类型、分辨率等媒体特征来确定是否需要适配。通常可在不解压缩经过压缩后的媒体的情况下获得那些参数。例如，扫描经过压缩后的媒体的文件头通常足够。在文件大小的预测器中，基于需要经过压缩的图像的解压缩的度量或任意像素级的计算使用参数在计算方面开销很大，并且需要几乎与实际转码相同的处理时间和功率。因此，避免这种类型的参数。

将特征数据用作文件大小的预测器10的输入。例如，在JPEG图像的情况下，特征数据可以是分辨率，例如图像的宽度和高度、质量因子QF、子采样方法、或从图像容易可用的任意其他信息。

在图1中所示的本发明的第一非限制性示例性实施例中，作为输入11像文件大小的预测器10提供i)在该图像的转换之前的图像的文件大小S(I)，ii)在转换之前的图像的原始质量因子QF_in，iii)在转换期间应用于图像的预期输出质量因子QF_out，和iv)在转换期间应用于图像的缩放因子(变焦因子)z，其中0＜z≤1。

参照图1，文件大小的预测器10包括量化器14，用于量化原始质量因子QF_in，输出质量因子QF_out，和缩放因子z，以获得量化的质量因子和量化的缩放因子对于本领域普通技术人员来说，量化器是已知的，因此在本说明书中将不再进一步描述。

文件大小的预测器10还包括基于阵列的、相对文件大小预测计算器16，用于基于预测阵列(以下将描述)预计算相对文件大小预测。这生成预测函数其给出图像的相对压缩文件大小预测/对其应用预期的输出质量因子QF_out和缩放因子(变焦因子)z。

最后，文件大小的预测器10包括转换的图像文件大小预测计算器18，向其提供在图像和预测函数的转换之前的图像的压缩文件大小S(I)，以计算在转换(图像J)之后的图像的文件大小预测19如下：

$> \hat{S} (I, {QF}_{out}, z) = S (I) \hat{s} ({QF}_{in}, {QF}_{out}, z) - - - (1)$ >

其中函数是相对大小预测，由以下的图1的生成输出19给出：

$> \hat{s} ({QF}_{in}, {QF}_{out}, z) = \frac{1}{| T_{QF (I)} |} \underset{J \in T_{QF (I)}}{Σ} s (J, {QF}_{out}, z) - - - (2)$ >

函数s(J，QF_out，z)代表转换图像J的文件大小的精确函数，具有预期的QF_out和缩放z。该函数由以下给出：

$> s (J, {QF}_{out}, z) = \frac{S (T (J, {QF}_{out}, z))}{S (J)} - - - (3)$ >

其中S(J)是转换图像J的压缩文件大小，T(J，QF_out，z)是应用缩放z和质量因子的改变QF_out之后返回压缩的、转换图像J的函数。表达式S(T())是涉及使用预期的输出质量因子QF_out和缩放因子z的转换图像J的压缩文件大小函数。

应注意，是具有与该图像相同QF的在训练集T中的图像子集，并且|T_QF(I)|是子集T_QF(I)的基数。并且函数T()可以是例如完整JPEG转码器。

此外，应注意，代表最佳最小均方估计量。当然，可容易验证：

$> \hat{s} ({QF}_{in}, {QF}_{out}, z) = \arg \min_{\hat{s}} \underset{J \in T_{QF (I)}}{Σ} {(s (J, {QF}_{out}, z) - \hat{s})}^{2} - - - (4)$ >

然而，由于函数在计算方面开销大，可使用该函数预计算相对文件大小预测的阵列，以缓解计算复杂度。因此，相对文件大小预测计算器16可通过预计算的文件大小预测的阵列M来使用，其索引是在图像转换之前的图像的量化的质量因子在图像转换期间应用的预期质量因子和在图像转换期间应用的缩放因子通过波浪符(～)来指示量化的值。

适当的量化将防止上下文稀释，同时允许有效地检索阵列M。可通过传统量化器(未示出)来量化所述值。由于量化器对于本领域普通基数人员是已知的，所以在本说明书中将不再进一步描述。

如上所示，基于阵列的相对大小预测计算器16的输入包括在图像的转换之前的量化的质量因子在图像转换期间的预期量化的输出质量因子和在图像转换期间量化的缩放因子以及基于阵列的相对大小预测计算器16包括相对文件大小预测阵列计算器(未示出)，向其提供这些输入以预计算相对文件大小预测的阵列。通过以下等式给出阵列M的项：

$> M_{Q {\tilde{F}}_{in}, Q {\tilde{F}}_{out}, \tilde{z}} = \frac{1}{| S_{Q {\tilde{F}}_{in}, Q {\tilde{F}}_{out, \tilde{z}}} |} \underset{J \in S_{Q {\tilde{F}}_{in}, Q {\tilde{F}}_{out \cdot \tilde{z}}}}{Σ} s (J, Q F_{out} (J), z (J)) - - - (5)$ >

其中QF_out(J)、z(J)是分别返回在转换期间使用的QF、或QF_out和缩放因子z的函数。函数s(J，QF_out(J)，z(J))(等式(5))返回当对于转换的图像J应用给定转换时所观察的相对文件大小改变。集代表所有图像的基数的集，所述所有图像具有落入相应量化单元中的质量因子和缩放因子。量化单元是量化到相同给定值的所有值的集。通过单元表示分别量化到的QF_in、QF_out和z所有值的集。这里，是具有以下内容的图像集：对于QF_in的值包含具有量化到的相同原始量化因子的图像集合的所有图像，量化到的输出量化因子QF_out的值，以及量化到的缩放因子z的值(这是三个集的交集)。如果使用更多的质量控制参数(超过QF)，则可以按参数特定的适当方式也对他们进行量化，并将其用作预测阵列的更多维数。函数s()是在转换图像J时所观察的精确相对文件大小预测。

由此，指示阵列M的一部分，即，具有索引和的阵列。例如，在表1中示出从图像训练集T优化的阵列

表1：相对文件大小预测

文件大小的预测器10的基于阵列的相对大小预测计算器18响应于相对文件大小预测和在图像转换之前的图像的文件大小S(I)，计算在转换(图像J)之后的图像的预测文件大小19，使用转换的图像文件大小预测计算器18如下：

$> \hat{S} (I, Q F_{out}, z) = S (I) M_{Q {\tilde{F}}_{in}, Q {\tilde{F}}_{out}, \tilde{z}} - - - (6)$ >

应指出，函数S(I)嵌入与在计算方面其他系统和方法明显以更大成本提取的图像I相关的某些信息。S(I)可看作保持与图像的特征相关的信息并且将其注入转换的图像文件大小预测计算器18的图像I的哈希函数。

根据第一非限制性示例性实施例的文件大小的预测器10是非参数预测器。

2.第一阵列计算器和训练方法

现在转到图2，描述根据第一方法的基于阵列的相对文件大小预测计算器20的训练阶段。可对于相对文件大小的预测器10实现这个方法。

在操作21，获取图像库。对于这个获取的方式超出本发明的范围，但是非限制性示例性实施例是web抓取器或进行现有图像的可靠检查的任意其他方式。在运行中由转码器获得的图像也可用于训练。

在操作22，使用库中的每个图像生成任意预期数目的范本。在子操作23，根据从库生成的图像生成大量图像，对其应用质量控制参数改变和缩放，其方式典型地兼容于在文件大小的预测器10中使用的量化方案。通过每个范本存储其质量因子QF_in、质量因子QF_out和缩放因子z。

在子操作24，将每个生成的范本增加到还包括来自库的原始图像的范本列表。重复操作22，只要在库中存在保留未处理的图像。

在操作26，计算阵列M。现在，处理在操作22中生成的每个范本以计算阵列M。

在子操作27，量化从给定范本提取的数据。将其质量因子QF_in、质量因子QF_out、和缩放因子z的值量化为和

在子操作28，使用量化的质量因子和和量化的缩放因子来更新阵列M。

在操作26之后，阵列M包含对于所有图像的相对文件大小预测。根据等式(5)：

其中根据等式(3)计算s()。是具有与相同量化的质量因子的所有图像的子集。是具有与相同量化的质量因子的所有图像的子集。是具有与相同量化的质量因子的所有图像的子集。是如等式(5)所述的这3个集的交集。

图2的基于阵列的相对文件大小预测计算器20是时间自适应的。例如，为了更新预测，可以在等式(2)中增加新范本，即仅通过子操作27和28。还可通过从预测集去除最旧范本来保持趋势自适应。幸好，在这样操作时，不需要图像的存储；仅需要存储转换值(质量因子和缩放因子)、时间戳、和在图像转换之后的相对文件大小。

应注意，在图2的基于阵列的相对文件大小预测计算器20中的更新时间是基数O(1)。通过O(1)，表示更新基于阵列的相对文件大小预测计算器20所需的操作数目是恒定的，即，不依赖于在训练集中图像的数目。

3.数值实例的第一集

使用图1的文件大小的预测器10和图2的相对文件大小预测计算器20来执行试验。在以上表1中呈现结果。例如，表1示出从图像训练集优化的并根据等式(5)计算的阵列

在仿真中使用的库包含70300个JPEG文件。库不受破坏文件约束，并且去除例如EXIF标签的所有元数据。EXIF是对于许多图像格式的共同扩展，包括JPEG，特别在从数码相机生成时其保存与图片或图像相关的附加信息。EXIF扩展用于存储数据，例如曝光细节、颜色平衡、相机品牌名称、和其他数字摄影信息。对于库中的每个原始范本(图像)，使用不同的质量因子QF_out和缩放因子z生成100(一百)个范本。在训练集和测试集之间的划分为约80/20。

表2示出对于预测阵列的预期绝对误差可看出，在和附近，预测误差最小。当和以及缩放因子例如在表2的左上方最不相同时，预测误差最大。此外，表2中的灰色部分代表10％或更小的预期绝对误差的区域。

表2：预期相对文件大小预测误差

表3给出对于典型的质量因子(例如)绝对的相对误差在某个阈值β以下的概率。对于不同的β和概率由以下给出：

$> P (| S (I_{out}) - \hat{S} (I_{out}) | < βS (I_{out}) | \tilde{z}, Q {\tilde{F}}_{in} = 80, Q {\tilde{F}}_{out} = 80) - - - (7)$ >

表3

应注意，误差的分布如预期地进一步远离100％的缩放扩散。

现在转到图5，给出估计量和量化阵列的几何说明。

图5示出一系列框，例如50，其代表与相应的阵列的行，具有被量化到最近10％的缩放因子。

在每个框50上方，绘制参与到估计量的计算中的所有图像的实际值的分布。通过点指示图像的分布。细线51连接不同的最小均方估计量这清楚地示出表面并不非常光滑。

绘图示出通过例如53的虚线指示四分位(例如52的矩形)和5％/95％限制。从图5可以看出，分布不是很广泛的分布，从而例如在预测误差上允许分摊界限。

在图5中可绘制远离四分位上方或下方的某些点。这些点是离群值(outlier)。某些离群值是其文件主要包括开销的图像。当图像具有很低分辨率时，QF和缩放改变对于总文件大小映像很小，因为相比于文件格式开销，例如标头、标记等，压缩的数据已经很小。然而，当忽略图像的原始比例时，则由于由等式(1)给出的最小均方估计量对于离群值敏感，所以文件大小的预测器可出现故障。因此，应作为预测参数包括原始分辨率。

4.第二转换的图像文件大小的预测器

现在将描述根据本发明的第二非限制性示例性实施例的文件大小的预测器30。文件大小的预测器30考虑图像的原始分辨率，因此存在离群值。

现在转到图3，根据本发明的第二非限制性示例性实施例的文件大小的预测器30包括参数量化器、和基于簇的相对文件大小预测计算器34，以生成相对文件大小预测35。

向文件大小的预测器30提供输入31，包括原始文件大小S(I)、原始质量因子QF(I)(指示为QF_in)、在图像转换之前的图像I的宽度W(I)和高度H(I)、以及在图像转换之后的预期质量因子QF_out和预期缩放因子(变焦因子)z。预测器30的输出37生成在应用了缩放因子z和质量因子QF_out的图像变换之后的图像的文件大小预测

量化器62处理质量因子QF_out和缩放因子z，以分别生成量化的质量因子和量化的缩放因子以用作向基于簇的相对文件大小预测计算器34的输入。

在量化器32中还发生质心确定，其根据图像I的宽度W(I)、高度H(I)和原始质量因子QF_in生成用于图像I的阵列以用作向基于簇的相对文件大小预测计算器34的输入。如果使用更多的质量控制参数，则他们可附加在的向量x_I(以下将定义)中。

基于簇的相对文件大小预测计算器34从量化器32接收阵列量化的质量因子和量化的缩放因子作为输入，以对于相对文件大小预测35公式化。

然后，转换的图像文件大小的预测计算器36使用来自计算器34的输出35计算在转换(图像J)之后的图像的文件大小预测37如下：

$> \hat{S} (I, Q F_{out}, z) = S (I) \hat{s} (Q F_{in}, Q F_{out}, z) - - - (1)$ >

其中函数是相对大小预测35。

如上所述，在例如存在离群值的情况下，图像的小分辨率破坏了上述文件大小的预测器10。为了克服这个问题，执行将图像空间分成区域的操作，其中将类似分辨率的区域分在一起。为此，使用簇将从图像库生成的范本分成类。此外，成簇的使用能够对于每个类优化最小均方估计量，由此进一步最小化预测误差。

应注意，成簇是非监督的学习技术，其划分在给定数目个分离子集(称为类)中的数据，从而在每个子集中的数据在所选度量下最大地类似。对于每个子集，计算代表值或原形(prototype)。一般地，原形是子集的质心。因此，成簇与概率分布函数优化的向量量化同义，其中量化级别是类的质心。

现在转到图4，簇计算器44将例如x_I＝(W(I)，H(I)，αQF(I))的向量关联至训练集T中的每个图像，其中α是使得质量因子维数达到与宽度和高度相同的量级的缩放常数。W(I)、H(I)、和QF(I)分别是图像I的宽度、高度和QF。如果我们使用更多质量控制参数，则可将他们附加在向量x_I中，并且可通过第二算法来考虑。

在成簇之前选择类的数目k。本领域普通技术人员知道如何选择这个类的数目k。例如，参数k足够大，以减少误差，并且足够小，以避免上下文稀释。

仍参照图4，库41的获取通过与图2中的操作21相同的方式进行。

新范本42的生成通过与图2中的操作22相同的方式进行，除了通过附加信息QF_out和z代替包括创建向量x_I＝(W(I)，H(I)，αQF(I))的子操作43。

因此，操作42创建簇计算器44所需的范本向量，以计算图像的训练集T到类的数目k的划分C。

通过定义，划分C通过C＝{C₁，C₂，...，C_k}给出，并且满足和

此外，以最佳划分C^＊将最小化任意向量x_I(其中I∈T)及其分配的质心之间的预期平方距离。最佳划分C^＊有以下给出：

$> C^{*} = \arg \min_{C} Σ_{i = 1}^{k} \underset{l \in C_{i}}{Σ} {| | x_{l} - {\overline{x}}_{i} | |}^{2} - - - (8)$ >

其中是非正式L₂范数，T是转置函数，是类C_i的原形。

图6中示出成簇的实例。在图6中，所有图像具有QF＝80，从而可二维地视觉化计算的文件大小预测。然而，真实的划分跨越宽度、高度和量化的QF三个(3)维度。

在决定了类的数目k之后，簇计算器44(见45)使用k平均算法计算类或簇。然后，原形计算器(见45)如下计算质心

$> {\overline{x}}_{i} = \frac{1}{| c_{i} |} \underset{l \in C_{i}}{Σ} x_{l} - - - (9)$ >

其代表类C_i中所有向量的原形。

计算最佳划分C^＊的复杂度使其在计算上不可行。然而，可使用k平均算法以高精度对其进行近似计算，如Leon Bottou和Yoshua Bengio的题为“Convergence properties of the K-means algorithms”的文章，在G.Tesauro、D.Touretzky和T.Leen编辑的Advances in Neural InformationProcessing Systems，第7卷，第585-592页，MIT出版社，1995年。类似于Newton算法，k平均算法具有超线性收敛性，在实践中这意味着为了良好近似需要相对少量的反复。K平均的细节和属性相信对于本领域普通技术人员是已知的，为此在本说明书中将不再进一步描述。

一旦计算了类或簇C，则阵列计算器(见图4中的47至49)对于每个计算的质心计算相对文件大小预测的阵列

在示例性实施例中，这些预测阵列中的每个具有二维的(但是，如果使用更多质量控制参数可具有更多维数)量化的输出质量因子和量化的缩放因子在操作48中执行量化。如下计算这些阵列中的每个项：

$> M_{\overline{x}, Q {\tilde{F}}_{out}, \tilde{z}} = \frac{1}{| C_{i} |} \underset{J \in C_{i}}{Σ} \frac{S (T (J, Q {\tilde{F}}_{out}, \tilde{z}))}{S (J)} - - - (10)$ >

其中J∈C_i是向基数|C_i|的类分配的图像，并具有质心

为了得到与从图像I的变换得到的图像J关联的估计量，在操作47中首先如下计算最近质心

$> {\overline{x}}_{J} = \arg \min_{{\overline{x}}_{i} \in C} | | x_{J} - {\overline{x}}_{i} | | - - - (11)$ >

最后，文件大小的预测器30的基于簇的相对文件大小预测计算器(图3)生成相对文件大小预测35，并且根据以下等式在计算器38中计算文件大小预测37：

$> \hat{S} (I, Q {\tilde{F}}_{out}, \tilde{z}) = S (I) M_{{\overline{x}}_{l}, Q {\tilde{F}}_{out}, \tilde{z}} - - - (12)$ >

应注意，在计算方面，预测器30的成本受限于计算最近质心的成本，后者可使用充分数据结构有效计算(细节见Jean-Daniel Boissonnat和Mariette Yvinec的“Algorithmic Geometry”，剑桥大学出版社，1998年)。一旦被定位，则可在恒定实践搜索阵列以生成的值。

5.第二阵列计算器和训练方法

再参照图4，现在将描述根据第二非限制性示例性实施例的训练相对大小预测阵列计算器40的第二方法。

可对于大小的预测器30来实现第二训练方法。

在操作42，使用库中的每个图像来生成任意预期数目个范本。在操作42，根据从库绘画的图像生成大量图像，对其应用质量控制参数改变和缩放，其方式典型地兼容于在基于簇的相对文件大小预测计算器34中使用的量化方案。通过每个范本J存储其向量x_J＝(W(J)，H(J)，αQF(J))，以及QF_out和z。

在子操作43，将每个生成的范本增加到还包括来自库的原始图像的范本列表。重复操作22，只要在库中存在保留未处理的图像。

在库计算器44，指定类或簇的数目k。

在操作45，计算簇和质心。使用等式(9)对于每个簇或类C_i(1≤i≤k)计算质心创建阵列但是不填充。

在操作46，填入与质心相关的阵列。

在操作47，对于每个范本J，使用在图像转换之前的质量因子QF_in(J)、宽度H(J)和高度H(J)，以找到相应质心及其相关的预测阵列。使用等式(11)计算最接近图像I的质心。

在操作48，量化在图像转换之后的预期质量因子QF_out和缩放因子z，以分别成为和

最后，在操作49，在使用等式(12)的预期量化的质量因子和缩放的应用之后使用和x_J＝(W(J)，H(J)，αQF(J))更新相对文件大小预测的阵列。

6.数值实例的第二集

在试验中，选择k使得k＝200。经验地发现α≈1000。

在表4中呈现结果。表4示出对于库中的图像的成簇的阵列的预期决定误差，其中QF_in＝80。通过等式(7)给出预期决定误差。

表4：预期相对文件大小预测误差

通过文件大小的预测器10，在周围聚集文件大小的预测器30的最小误差，其中并且通过表4的一部分给出最大预测误差，其中和缩放因子在表4的左上方最不相同。类似于表2，表4的灰色部分相应于10％或更小的预期绝对误差的区域。然而，当比较表2和4的两个(2)灰色部分时，表4的预期绝对误差明显小于表2，这是因为簇的使用。例如，在最困难的转码设置(即，其中和)中，从表2到表4，误差从112.93％下降到24.82％。

同样，尽管根据非限制性示例性实施例的系统和方法预测经过缩放以及质量控制参数(在这种情况下为QF(质量因子))的改变而转换的JPEG图像的文件大小，但是应理解，相同的构思可应用于例如GIF(图形交换格式)的其他类型格式以及例如颜色数量、颜色深度、颜色分量采样结构等的其他质量控制参数、以及例如颜色增强和裁剪的转换。

尽管通过非限制性示例性实施例在以上说明书中描述了本发明，但是在不脱离本发明的精神和特征的情况下，可在所附权利要求的范围内修改这些示例性实施例。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 用于预测经过通过缩放以及质量控制参数的改变而转换的图像的文件大小的系统和方法 [P] . 中国专利： CN101842811B . 2012.05.23
2. 用于预测经过通过缩放以及质量控制参数的改变而转换的图像的文件大小的系统和方法 [P] . 中国专利： CN101842811A . 2010-09-22
3. System and method for predicting the file size of images subject to transformation by scaling and a change of quality-controlling parameters [P] . IL204727A . 2017-05-29

机译：通过缩放和改变质量控制参数来预测要进行变换的图像的文件大小的系统和方法
4. System and method for predicting the file size of images subject to transformation by scaling and a change of quality-controlling parameters [P] . 美国专利： US8224104B2 . 2012-07-17

机译：通过缩放和改变质量控制参数来预测要进行变换的图像的文件大小的系统和方法
5. SYSTEM AND METHOD FOR PREDICTING THE FILE SIZE OF IMAGES SUBJECT TO TRANSFORMATION BY SCALING AND A CHANGE OF QUALITY-CONTROLLING PARAMETERS [P] . 欧洲知识产权局专利： EP2210236B1 . 2018-07-11

机译：通过缩放和质量控制参数的更改来预测要进行转换的图像的文件大小的系统和方法