首页> 中国专利> 基于图像熵的无参考图像质量评价方法

基于图像熵的无参考图像质量评价方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开一种基于图像熵的无参考图像质量评价方法，包括步骤S1，提取待测图像特征，利用支持向量分类(Support Vector Classifier，SVC)识别出待测图像属于每种失真类型的概率pi；所述图像特征包括不同彩色通道之间的互信息、灰度图像的二维熵以及滤波后的子带图像的二维熵和互信息；步骤S2，分别假设待测图像属于某个特定失真类型，用支持向量回归(Support Vector Regression，SVR)计算对应失真类型的得分qi，通过加权求和得到待测图像的质量指数。在LIVE和TID2013数据库上的实验表明，该算法表现出良好的性能和主客观评价一致性。

著录项

公开/公告号CN109325550A

专利类型发明专利
公开/公告日2019-02-12

原文格式PDF
申请/专利权人武汉大学;
展开▼

申请/专利号CN201811299858.7
发明设计人杨光义;陈浩;李梦涵;陈佳佳;
展开▼

申请日2018-11-02
分类号G06K9/62(20060101);G06T7/00(20170101);G06T7/90(20170101);
代理机构42222 武汉科皓知识产权代理事务所(特殊普通合伙);
代理人王琪
地址 430072 湖北省武汉市武昌区珞珈山武汉大学
入库时间 2024-02-19 06:52:35

法律信息

法律状态公告日

法律状态信息

法律状态
2022-10-14

未缴年费专利权终止 IPC(主分类):G06K 9/62 专利号:ZL2018112998587 申请日:20181102 授权公告日:20200710

专利权的终止
2020-07-10

授权

授权
2019-03-08

实质审查的生效 IPC(主分类):G06K9/62 申请日:20181102

实质审查的生效
2019-02-12

公开

公开

说明书

技术领域

本发明涉及图像质量处理技术领域，尤其涉及一种基于图像熵的无参考图像质量评价方法。

背景技术

我们处于一个信息大爆炸的时代，每天被铺天盖地的信息重重包围。图像作为视觉信息的来源，蕴含了大量的有价值信息。由于图像信息相对于其它信息有着无可比拟的优点，因此对图像信息进行合理处理成为各领域中不可或缺的手段。在图像的处理和传输等过程中，由于成像系统、处理方法和传输介质等的不完善，加上物体运动、噪声污染等原因，不可避免地带来图像的失真和降质。而图像质量的好坏直接影响到人们的主观感受和信息量的获取，因此，图像质量评价(Image quality assessment，IQA)的研究在近年来受到越来越广泛的重视。

按照是否需要人的参与，图像质量评价方法可以分为主观评价和客观评价。主观图像质量评价由人眼视觉效果对图像进行评价。与此对应，客观图像质量评价算法则基于特定算法由计算机设备对图像进行自动评价，其终极目标是希望用计算机来代替人类视觉系统去观察和认知图像。主观评价结果随机性较强，很难在实时图像系统中应用，于是客观质量评价算法被广泛研究。客观质量评价算法又被分为全参考(Full reference，FR)质量评价方法、半参考(部分参考)(Reduced reference，RR)质量评价方法和无参考(Noreference，NR)质量评价方法。其中，全参考方法同时有原始(无失真、参考)图像和失真图像，难度较低，核心是对比两幅图像的信息量或特征相似度，是研究比较成熟的方向。无参考方法只有失真图像，难度较高，是近些年的研究热点，也是IQA中最有挑战的问题，由于无参考方法最具实用价值，有着非常广泛的应用前景。

目前，学者们提出的无参考质量评价方法可以分为两大类：专用型图像质量评估方法和通用型图像质量评估方法。通用型图像质量评估方法又可以分为显式和隐式两种。现有的显式通用型NR-IQA算法面临以下问题：1)图像的彩色空间在NR-IQA算法中较少被考虑；2)部分NR-IQA算法仅利用像素的统计特征而未考虑特征的空间分布。Liu等人分别在空域和频域中计算图像块的一维熵，将所有局部熵值的平均数和偏度作为图像的特征来实现SSEQ算法。S.Gabarda等人使用空间/空间频率分布作为概率密度函数的近似来在局部基础上计算逐像素熵值，测量出的熵的方差是方向性的函数，将方差作为各向异性指标，并用这种各向异性度量来衡量图像的保真度和质量。基于一维熵的算法能体现图像灰度分布的聚集特征，却不能反映图像灰度分布的空间特征。

发明内容

本发明针对显式通用型NR-IQA算法中存在的问题，提出了一种基于图像熵的通用无参考图像质量评价算法(ENIQA)，该算法利用图像块间的统计学规律，通过计算图像块的信息熵，提取图像局部结构特征。使用大量样本训练模型，通过交叉验证确定合适的模型参数，对测试图像进行质量预测。算法分别提取图像颜色通道之间的互信息、反映图像空间特征的二维熵以及滤波后的子带图像的二维熵和互信息，作为彩色图像的特征集合，然后利用支持向量分类(Support Vector Classifier,SVC)进行失真分类，利用支持向量回归(Support Vector Classifier,SVR)进行质量预测，得到最终的质量评价分数。本发明在LIVE和TID2013数据库上进行测试，均取得了很好的结果。实验表明，本发明对彩色图像的评价表现出良好主客观评价一致性，体现了其良好的整体性能和泛化能力。

本发明的上述技术问题主要是通过下述技术方案得以解决的，基于图像熵的无参考图像质量评价方法，具体步骤如下：

步骤S1，提取待测图像特征，利用支持向量分类(Support Vector Classifier，SVC)识别出待测图像属于每种失真类型的概率p_i；

所述图像特征包括不同彩色通道之间的互信息、灰度图像的二维熵以及滤波后的子带图像的二维熵和互信息；

步骤S2，分别假设待测图像属于某个特定失真类型，用支持向量回归(SupportVector Regression，SVR)计算对应失真类型的得分q_i，通过加权求和得到待测图像的质量指数，所述质量指数越高，图像质量越好。其中，步骤S1中提取图像特征的过程，通过引入不同彩色通道之间的互信息、灰度图像的二维熵以及滤波后的子带图像的二维熵和互信息来表征图像的局部结构信息。由于，图像的一维熵表示图像中灰度分布的聚集特征所包含的信息量，却不能反映图像灰度分布的空间特征。为了表征这种空间特征，在一维熵的基础上引入能够反映图像灰度分布空间特征的二维熵。

进一步的，步骤S1中提取图像特征的具体实现方式如下，

步骤S11，对于输入彩色图像，首先计算R/G/B三个颜色通道之间的互信息作为特征组1，特征组1包含3个特征；当自然彩色图像的某个区域色彩发生了变化，其相应R、G及B分量的像素灰度值也同时发生变化。而且，虽然一幅彩色图像的R、G及B分量的像素灰度值大小不同，但是它们的纹理、边缘、相位和灰度变化梯度具有非常好的相似性和一致性。因此，将R、G和B三通道间的互信息作为特征；

步骤S12，将彩色图像灰度化后进行分块，分别计算每一块区域的局部二维熵，对获得的所有局部熵值进行池化后计算平均值以及偏度作为特征组2，特征组2中包含2个特征；

步骤S13，对灰度输入图像进行2尺度4方向的Log-Gabor滤波，得到滤波后的8张子带图像，并分别对这8个子带图像进行分块，计算每幅子带图像局部块的二维熵，对获得的所有局部熵值进行池化后计算平均值和偏度，作为特征组3，特征组3中包含16个特征；

步骤S14，计算4个不同方向上的子带图像间的互信息，作为特征组4，特征组4中包含6个特征；

步骤S15，计算2个不同尺度上的子带图像间的互信息，作为特征组5，特征组5包含1个特征；

步骤S16，对输入彩色图像进行1次下采样，得到类似的28个特征，并入对应的特征组，因此，对于一幅输入彩色图像，共提取56个特征。

进一步的，步骤S12中，图像二维熵的具体计算方式如下，

将彩色图像X灰度化后，选择灰度图像的邻域均值作为空间分布特征量，与图像的像素灰度组成特征二元组，记为(x₁，x₂)，其中x₁表示像素的灰度值(0≤x₁≤255)，x₂表示领域灰度均值(0≤x₂≤255)，某像素的灰度值与其周围像素的灰度分布的综合特征为：

其中，f(x₁，x₂)为特征二元组(x₁，x₂)出现的频数，M、N为图像X的尺寸；

选取像素点x₁的8邻域像素均值作为x₂，定义离散的图像二维熵为：

其中，依此构造的图像二维熵可以在反映图像所包含的信息量的前提下，突出反映图像中像素位置的灰度信息和像素邻域内灰度分布的综合特征。不论是失真等级还是失真类型，都可以用二维熵区分，因此将二维熵作为特征。

进一步的，步骤S12中，首先对待测图像进行显著性检测，按照人眼视觉优先级来对图像块进行池化，从而筛选出人类更为重视的图像块，根据不同图像块的显著性值，对其排序后筛选显著性更高的80％进行局部二维熵的统计特性(均值和偏度)计算。

进一步的，使用基于傅里叶频谱残差方法计算待测图像的显著性图。

进一步的，步骤S11中，互信息的具体计算方式如下，

以彩色图像X的R和G通道为例，假设x_r和x_g分别表示彩色图像X中这两个通道的灰度值，p(x_r)、p(x_g)和p(x_r，x_g)分别表示对应的灰度概率分布和联合概率分布，则R和G通道之间的互信息定义为：

其中，H(x_r)是彩色图像X的R通道的二维熵，H(x_g)是G通道的二维熵，H(x_r，x_g)是两幅图像之间的联合熵，定义为：

进一步的，步骤S13中，使用的二维Log-Gabor滤波器的传递函数可表示为：

其中，f₀为中心频率，θ₀为滤波器方向，σ_r用于确定径向带宽，σ_θ用于确定方向带宽；

采用的Log-Gabor滤波器组从左到右的方向依次为：0°、45°、90°、135°，并且有2个尺度，利用这个Log-Gabor滤波器组对待测图像滤波，分别得到图像在对应4个方向，2个尺度的8个子带分量。

进一步的，步骤S16中使用最近邻算法对待测图像进行下采样。

进一步的，步骤S2中，通过加权求和得到待测图像的质量指数的计算公式为，

Index＝Σp_iq_i>

其中p_i为待测图像属于第i种失真类型的概率，q_i待测图像为对应第i种失真类型的得分。

进一步的，步骤S1中所述失真类型包括高斯模糊、高斯白噪声、JPEG压缩、JPEG2000压缩。

本发明的优点和有益效果：

本发明提出了一种基于图像熵的NR-IQA算法(ENIQA)。该算法利用图像块间的统计学规律，通过计算图像块的信息熵，提取图像局部结构特征。我们使用大量样本训练模型，通过交叉验证确定合适的模型参数，对测试图像进行质量预测。在LIVE和TID2013数据库上的实验表明，该算法表现出良好的性能和主客观评价一致性。

附图说明

图1是本发明实施例算法框架流程图。

图2是本发明实施例计算图像二维熵过程中的像素点及其8邻域图。

图3是本发明实施例中二维熵统计特性图，其中(a)为原图及5张相同失真等级不同失真类型的失真图求取二维熵的统计特性图，(b)为原图及5张相同失真类型不同失真等级的失真图求取二维熵的统计特性图。

图4是本发明实施例LIVE数据库中不同IQA算法的SROCC分布箱型图。

图5是本发明提出的图像质量评价方法ENIQA在数据库LIVE和TID2013上的散点图拟合实验结果，其中(a)为ENIQA在数据库LIVE上的散点图拟合实验结果，(b)为ENIQA在数据库TID2013上的散点图拟合实验结果。

具体实施方式

下面结合附图和实施例对本发明作进一步说明：

实施例

如图1所示，本发明提出的基于图像熵的无参考图像质量评价方法(简称ENIQA)，包含以下步骤：

第一步，提取图像特征，利用支持向量分类识别出待测图像每种失真类型的概率p₁/p₂/p₃/p₄。

第二步，用支持向量回归计算对应失真类型的得分q₁/q₂/q₃/q₄，通过加权求和得到待测图像的质量指数。

本实施例在LIVE和TID2013数据库上开展实验。LIVE数据库由29张参考图像和779张失真图像5种失真类别组成；TID2013数据库由25张参考图像和3000张失真图像24种失真类别组成。在这25张参考图像中，只有24张是自然图像，所以我们仅在24自然图像上开展测试。同时，为了保证训练和测试的一致性，我们在开展跨库测试时，仅选取与LIVE数据库相同的4种失真类别(JP2K、JPEG、高斯噪声和高斯模糊)开展测试。

本发明提出的基于图像熵的无参考图像质量评价方法，第一步中提取图像特征的过程，通过引入不同彩色通道之间的互信息、灰度图像的二维熵以及滤波后的子带图像的二维熵和互信息来表征图像的局部结构信息。

表1特征描述

对于输入彩色图像，首先计算R/G/B三个通道之间的互信息作为特征组1；然后将彩色图像灰度化后进行分块，分别计算每一块区域的局部二维熵，对获得的所有局部熵值进行池化后计算平均值以及偏度作为特征组2；同时对灰度输入图像进行2尺度4方向的Log-Gabor滤波，得到滤波后的8张子带图像，并分别对这8个子带图像进行分块，计算每幅子带图像局部块的二维熵，对获得的所有局部熵值进行池化后计算平均值和偏度，作为特征组3；计算4个不同方向上的子带图像间的互信息，作为特征组4；计算2个不同尺度上的子带图像间的互信息，作为特征组5。使用最近邻算法对图像进行1次下采样，得到类似的28个特征，并入对应的特征组。这样，对于一幅输入彩色图像，共提取56个特征。每组特征向量的特征描述如表1所示。

图像二维熵的计算过程如下：将彩色图像X灰度化后，选择灰度图像的邻域均值作为空间分布特征量，与图像的像素灰度组成特征二元组，记为(x₁，x₂)，其中x₁表示像素的灰度值(0≤x₁≤255)，x₂表示领域灰度均值(0≤x₂≤255)，某像素的灰度值与其周围像素的灰度分布的综合特征为：

其中，f(x₁，x₂)为特征二元组(x₁，x₂)出现的频数，M、N为图像X的尺寸。

选取像素点x₁的8邻域像素均值作为x₂，如图2所示，定义离散的图像二维熵为：

依此构造的图像二维熵可以在反映图像所包含的信息量的前提下，突出反映图像中像素位置的灰度信息和像素邻域内灰度分布的综合特征。我们对一张原图(选自LIVE库无失真图”monarch.bmp”)以及对应的5张相同失真等级不同失真类型的失真图(DMOS值都在25左右，失真类型分别是JP2K、JPEG、白噪声、高斯模糊和快衰落)进行图像分块求取二维熵，统计特性如图3(a)所示。类似的，我们对同样的原图以及对应的5张相同失真类型不同失真等级的失真图(以White noise为例)进行图像分块求取二维熵，统计特性如图3(b)所示。图3中，横轴代表熵值，纵轴代表归一化后的图像块数。从图3可以看出，不论是失真等级还是失真类型，都可以用二维熵区分，因此我们将二维熵作为特征是有意义的。

计算图像块的二维熵的统计特性时，对待测图像进行显著性检测，按照人眼视觉优先级来对图像块进行池化，从而筛选出人类更为重视的图像块。根据不同图像块的显著性值，对其排序后筛选显著性更高的80％进行局部二维熵的统计特性(均值和偏度)计算。本实施例使用基于傅里叶频谱残差方法计算待测图像的显著性图。

步骤S1中提取不同彩色通道之间的互信息作为特征组。以彩色图像X的R和G通道为例，假设x_r和x_g分别表示彩色图像X中这两个通道的灰度值，p(x_r)、p(x_g)和p(x_r，x_g)分别表示对应的灰度概率分布和联合概率分布。则R和G通道之间的互信息定义为：

其中，H(x_r)是彩色图像X的R通道的二维熵，H(x_g)是G通道的二维熵，H(x_r，x_g)是两幅图像之间的联合熵，定义为：

所述步骤S1中使用的二维Log-Gabor滤波器的传递函数可表示为：

其中，f₀为中心频率，θ₀为滤波器方向，σ_r用于确定径向带宽，σ_θ用于确定方向带宽。采用的Log-Gabor滤波器组从左到右的方向依次为：0°、45°、90°、135°，并且有2个尺度。利用这个Log-Gabor滤波器组对待测图像滤波，分别得到图像在对应4个方向，2个尺度的8个子带分量。

根据提取的图像特征，用支持向量回归计算对应失真类型的得分q₁/q₂/q₃/q₄，通过加权求和得到待测图像的质量指数：

本文采用5参数非线性逻辑回归函数拟合数据，采用斯皮尔曼等级相关等级相关系数SROCC、皮尔森线性相关系数PLCC和均方根误差RMSE评估算法性能。

其中，z是客观IQA分数，f(z)是IQA回归拟合分数，β_i(i＝1，2，...，5)是回归函数的参数。

性能比较如下：

在LIVE数据库上实验时，我们将ENIQA和10种最先进的方法进行比较测试。三种FRIQA模型包括：PSNR，SSIM和VIF，七种NR IQA模型包括：BIQI，DIIVINE，BLIINDS II，BRISQUE，NIQE，ILNIQE和SSEQ。为了保证实验的公平性，我们随机抽取80％的样本组成训练集，20％的样本组成测试集，通过1000次训练－测试实验，得到1000次交叉验证的结果，取1000次实验结果的中位数作为最终指标。在NR模型的训练中，我们使用LIBSVM工具包实现SVC和SVR，两者均采用径向基函数(Radial Basis Function，RBF)内核。因为FR模型不需要训练，我们只测试针对失真图像的FR方法(不包括LIVE数据库的参考图像)。实验结果见表2-4，表现最好的两个指数用黑体标了出来。可以看出，ENIQA在LIVE数据库上表现出色。整体性能除了略逊于BRISQUE之外，均超过其它NR算法，甚至领先于SSIM等经典FR算法。

表2在LIVE数据库上的1000次训练测试对的SROCC的中值

表3在LIVE数据库上的1000次训练测试对的PLCC的中值

表4在LIVE数据库上的1000次训练测试对的RMSE的中值

为了更加直观的比较不同算法的性能差异，提供有关数据位置和分散情况的关键信息，图4显示了1000次训练－测试试验中11种IQA方法(包括本发明实施例提出的ENIQA方法)的SROCC分布的箱形图。同时，我们针对这些算法开展t测试，实验结果如表5所示。零假设是指相关的行等于平均相关值的列在95％置信水平。另一种假设是，行的平均相关值大于(或小于)列的平均相关值。表5显示哪一行在统计上优于(1)、等同(0)或低于(-1)哪一列。

表5 SROCC值的t测试结果

从图4可以看出，除了略逊于BRISQUE之外，ENIQA在t测试中均超过其它FR和NR算法。在异常值数量上，ENIQA除了略逊于SSIM之外，甚至超过了BRISQUE。表5可以得到和图4类似的结论，充分说明了ENIQA的优异性能。

为了测试评价模型对不同样本的泛化能力，本文将整个LIVE数据库用作训练集，在TID2013数据库中选择与训练样本失真类型相同(JPEG2000、JPEG压缩、白噪声和高斯模糊)的图像作为测试集，得到算法的性能指标，如表6所示。表现最好的两个IQA指数已用黑体标出。从表6可以看出，ENIQA算法在TID2013数据库上有优越的表现，性能指标超过所有其他NR算法，甚至超过了在LIVE库上表现一直很好的BRISQUE，反映了ENIQA良好的泛化能力。

表6模型在LIVE数据库上训练，TID2013数据库上进行测试的性能指标

图5示出了ENIQA在LIVE和TID2013数据库上的散点图拟合实验结果。同前面的实验类似，在LIVE数据库上开展散点图实验时，我们用80％的随机样本训练，然后用剩下的20％样本测试，得到某次散点图拟合结果，如图5(a)。在TID2013数据库上开展散点图实验时，我们用整个LIVE数据库训练，然后在TID2013数据库(部分)中测试，得到散点图拟合结果，如图5(b)。从图5可以看出，算法拟合的散点图在整个坐标系中均匀分布，并且与DMOS/MOS具有很强的线性关系，进一步证明了算法的优越表现。

本领域的技术人员容易理解，以上所述仅为本发明较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所做的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于图像熵的无参考图像质量评价方法 [P] . 中国专利： CN109325550B . 2020.07.10
2. 一种基于HSL和图像熵的SAR图像和光学图像融合方法 [P] . 中国专利： CN109118463B . 2021.10.19
3. Gaze tracking apparatus and method using difference image entropy [P] . 美国专利： US8274578B2 . 2012-09-25

机译：使用差异图像熵的注视跟踪装置和方法
4. APPARATUS AND METHOD FOR FOCUSING POSITION DECISION USING ENTROPY OF IMAGE [P] . 韩国专利： KR101025568B1 . 2011-03-28

机译：利用图像熵来进行位置决定的装置和方法
5. Gaze Tracking Apparatus and Method using Difference Image Entropy [P] . 韩国专利： KR100947990B1 . 2010-03-18

机译：使用差分图像熵的注视跟踪装置和方法