首页> 中国专利> 基于单张目标画像的人脸画像合成方法

基于单张目标画像的人脸画像合成方法

摘要

本发明公开了一种基于单张目标画像的人脸画像合成方法,在数据库样本集内随机选择一对照片与画像对中的画像作为目标画像,将对所述目标画像进行分块后得到的图像块进行划分获得第一图像块子集和第二图像块子集,将所述获得的第一图像块子集进行矩阵分解得到投影矩阵,将所述第二图像块子集投影到投影矩阵得到第一投影系数集合;然后将测试照片分块后得到的图像块投影到投影矩阵得到第二投影系数集合,根据相似性尺度距离所述第二投影系数集合在第一投影系数集合中查找到匹配的图像块,将查找到的图像块合成得到初始合成图像;最后进行迭代合成最终合成图像。本发明省去费时费力的收集大量照片与画像对的过程,方便合成各种风格的画像。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-08-15

    授权

    授权

  • 2015-07-08

    实质审查的生效 IPC(主分类):G06T11/00 申请日:20150312

    实质审查的生效

  • 2015-06-10

    公开

    公开

说明书

技术领域

本发明属于图像处理技术领域,具体涉及一种基于单张目标画像的人脸画 像合成方法。

背景技术

人脸画像合成有许多重要的实际应用,比如数字娱乐。目前推特和微博等 社交网络变得越来越流行,很多用户将自己的画像上传到网上作为账户的头像 以增加娱乐效果。为了体现个性化和增加趣味性,用户往往更希望自己的画像 能有多种风格可供选择。此外,待合成照片的约束越少,用户就会更加亲睐, 例如,待合成照片可以是各种角度,各种表情,各种背景以及全身照、合照等 等。

目前的人脸画像合成方法可以分成以下三大类:一,基于子空间学习的人 脸画像合成方法;二,基于贝叶斯推断的人脸画像合成方法;三,基于稀疏表 示的人脸画像合成方法。

Liu等人在文献“Liu Q,Tang X,Jin H,et al.Anonlinear approach for face  sketch synthesis and recognition[C]//Computer Vision and Pattern Recognition, 2005.CVPR 2005.IEEE Computer Society Conference on.IEEE,2005,1: 1005-1010.”中采用子空间学习的方法来模拟照片转化成画像的非线性过程。具 体实施方式是:先将训练集中的照片-画像对及测试照片划分成大小相同及重叠 区域相同的图像块,对于测试照片中的每一个照片块在训练集中寻找它的K个 近邻照片块并计算重建系数W,然后再将K个照片块对应的K个画像块用重建 系数W进行加权组合得到待合成画像块,最后将所有的待合成画像块融合得到 合成画像。但是该方法存在以下缺点:各合成画像块都是单独合成,没有考虑 画像块之间的邻域关系,导致融合处的画像不自然,存在噪声。

Wang等人在文献“Wang X,Tang X.Face photo-sketch synthesis and  recognition[J].PatternAnalysis andMachine Intelligence,IEEE Transactions on, 2009,31(11):1955-1967.”中提出了一种基于贝叶斯推断的人脸画像合成方法。 具体操作步骤如下:首先将训练集中的照片-画像对以及测试照片用相同的方式 分块,然后对每一个测试照片块在训练集中寻找它的K个候选照片块,根据测 试照片块与K个候选照片块之间的关系以及合成画像中相邻位置的画像块之间 的关系,建立马尔可夫随机场模型对每个测试照片块寻找一个最佳的训练画像 块作为待合成画像块,最后将所有的待合成画像块融合得到最终的合成画像。 该方法存在以下缺陷:每个测试照片块最终只选择一个训练画像块作为待合成 画像块进行画像合成,导致合成画像存在块效应和细节缺失的问题。

高新波等人申请的专利技术“基于稀疏表示的画像-照片生成方法”(申请 号:201010289330.9申请日:2010-09-24申请公布号:CN 101958000 A)中公 开了一种基于稀疏表示的人脸画像合成方法。具体实施方式是:首先采用已有 的画像合成方法生成画像的初始估计,然后再利用稀疏表示的方法合成出合成 画像的细节信息,最后将初始估计和细节信息进行线性叠加得到最后的合成画 像。该方法存在以下缺陷:合成画像的好坏依赖于初始画像合成方法,此外细 节信息的线性叠加使得合成画像不自然。

上述三类画像合成方法需要许多照片-画像对作为训练集,然而收集照片- 画像对费时费力。此外,当需要合成测试照片对应的某种类型的画像时,上述 三类画像合成方法则需要收集许多对应类型的照片-画像对作为训练集,然而在 大多数情况下,很难收集到许多指定类型的照片-画像对。此外,上述三类画像 合成方法只适用于测试照片与训练集照片背景相同的情况,当测试照片与训练 集照片背景不同时,合成画像的背景会存在噪声。当测试照片中存在非人脸部 件,例如眼镜、发卡等,而训练集照片中都不存在这些非人脸部件时,合成画 像会丢失测试照片中的非人脸部件。

发明内容

有鉴于此,本发明的主要目的在于提供一种基于单张目标画像的人脸画像 合成方法。

为达到上述目的,本发明的技术方案是这样实现的:

本发明实施例提供一种基于单张目标画像的人脸画像合成方法,该合成方 法为:在数据库样本集内随机选择一对照片与画像对中的画像作为目标画像, 其他剩余照片与画像对中的照片作为测试照片样本集,将对所述目标画像进行 分块后得到的图像块进行划分获得第一图像块子集和第二图像块子集,将所述 获得的第一图像块子集进行矩阵分解得到投影矩阵,将所述第二图像块子集投 影到投影矩阵得到第一投影系数集合;然后将从测试照片样本集中选择的测试 照片分块后得到的图像块投影到投影矩阵得到第二投影系数集合,根据相似性 尺度距离所述第二投影系数集合在第一投影系数集合中查找到距离最近的前K 个系数,根据获得的前K个系数在第二图像块子集查找到匹配的图像块,将查 找到的图像块合成得到初始合成图像;将对所述目标画像,测试照片以及初始 合成图像进行分块得到第三图像块子集,将所述测试照片分块后得到的图像块 在第三图像块子集内根据图像块的多尺度特征查找匹配的图像块,将所述查找 到的图像块构成新合成图像,将新合成图像替代初始合成图像,重复迭代上述 步骤合成最终合成图像。

上述方案中,所述在数据库样本集内随机选择一对照片与画像对中的画像 作为目标画像,其他剩余照片与画像对中的照片作为测试照片样本集,具体为: 将CUFS数据库中所有照片与画像对中的图像由彩色图像变成灰度图像,再从 照片与画像对集合中选择一对照片与画像中的画像作为训练画像A,再将剩下 的照片与画像对中的所有照片作为测试照片样本集B,并从测试照片样本集B 中选取一张测试照片T。

上述方案中,所述将对所述目标画像进行分块后得到的图像块进行划分获 得第一图像块子集和第二图像块子集,具体为:

3a)对训练画像A建立n层高斯金字塔,高斯金字塔中的每一层都对应着某 个尺度下的画像对:

3a1)构造尺度值为σ的高斯函数:

G(x,y,σ)=12πσ2e-(x2+y2)

其中,G(x,y,σ)表示在σ尺度值下的高斯函数,x,y分别表示图像中像 素点对应的横、纵坐标值;

3a2)将图像与3a1)所得的高斯函数进行卷积,得到高斯金字塔第一层的图 像;

3a3)设i=1;

3a4)将尺度值σ乘以一个比例系数i+1作为新的尺度因子来卷积原图像, 再将卷积后的图像做比例因子为2i的降采样,得到高斯金字塔第i+1层的图像;

3a5)设i=i+1;

3a6)重复步骤3a4)-3a5)n-2次,即可得到n层高斯金字塔;

3b)将高斯金字塔中奇数层对应的画像设为字典训练样本集A1,将高斯金 字塔中偶数层对应的画像设为合成训练样本集A2;

3c)将字典训练样本集A1和合成训练样本集A2中所有的画像划分为相同 大小及相同重叠程度的块,从而分别得到字典训练画像块集合SA1即第一图像块 子集和合成训练画像块集合SA2即第二图像块子集。

上述方案中,所述将所述获得的第一图像块子集进行矩阵分解得到投影矩 阵,具体为:

4a)对字典训练画像块集合SA1即第一图像块子集利用有效稀疏编码方法得 到训练画像块特征字典Ds

4a1)初始化训练画像块特征字典为高斯矩阵,并将高斯矩阵每一个 列向量归一化为单位向量;其中,d表示训练画像块特征字典Ds中字典元素的 维数,n表示训练画像块特征字典Ds中字典元素的个数;

4a2)给定字典训练画像块集合SA1以及初始化训练画像块特征字典Ds,按 照下式得到字典训练画像块集合SA1的初始稀疏表示集合C:

C=arg{min||SA1-DsC||22||C||1}

其中,λ是正则化参数,设值为0.15,||·||2表示2范数,||·||1表示1范数, 当给定Ds时,C可以通过特征符号搜索算法进行求解;

4a3)给定字典训练画像块集合SA1以及由步骤4a2)得到的初始稀疏表示集 合C,按照下式得到估计的训练画像块特征字典Ds

Ds=arg{min||SA1-DsC||22},

s.t.||Dsi||221,i=1,...,n

当给定C时,通过拉格朗日对偶方法求解出Ds

4a4)交替迭代步骤4a2)和步骤4a3),直到以下目标函数收敛,得到最终的 训练画像块特征字典Ds

minDs,C||SA1-DsC||22+λ||C||1,

s.t.||Dsi||221,i=1,...,n.

上述方案中,所述将所述第二图像块子集投影到投影矩阵得到第一投影系 数集合,具体为:将合成训练样本集A2中所有的画像划分为相同大小及相同重 叠程度的块,从而得到合成训练画像块集合SA2={y1,…,yj,…,yN}即第二图像块子 集;

5a)给定训练画像块yj和训练画像块特征字典Ds

5b)构造以下最优化问题来求解训练画像块yj对应的稀疏表示cj

从而得到合成训练画像块集合SA2对应的稀 疏表示集合Cs,其中,λ是正则化参数,设值为0.15,上述最优化问题可利用 最小角回归方法进行求解;

5c)对合成训练画像块集合SA2即第二图像块子集中的每个训练画像块yj重复步骤5a)和5b),得到合成训练画像块集合SA2对应的稀疏表示集合即第一投 影系数集合:

Cs={c1,…,cj,…,cN};

其中,cj表示第j个画像块yj的稀疏表示,由于每个稀疏表示cj都包含稀疏 系数值vj以及稀疏系数值在稀疏编码中被求解的顺序oj,因此稀疏表示集合Cs包含有稀疏系数值集合Vs以及对应的稀疏系数值在稀疏编码中被求解的顺序集 合Os,其表示如下:

Vs={v1,…,vj,…,vN};

Os={o1,…,oj,…,oN}。

上述方案中,所述将从测试照片样本集中选择的测试照片分块后得到的图 像块投影到投影矩阵得到第二投影系数集合,具体为:

6a)将测试照片T划分为相同大小及相同重叠程度的测试照片块集合: P={x1,…,xi,…,xM},xi表示测试照片T中的第i个照片块;

6b)将每个测试照片块xi用训练画像块特征字典Ds进行稀疏编码,得到xi对应的稀疏表示ci即第二投影系数集合;

其中,ci表示第i个测试照片块xi的稀疏表示,每个稀疏表示ci都包含稀疏 系数值vi以及稀疏系数值在稀疏编码中被求解的顺序oi

上述方案中,所述根据相似性尺度距离所述第二投影系数集合在第一投影 系数集合中查找到距离最近的前K个系数,根据获得的前K个系数在第二图像 块子集查找到匹配的图像块,具体为:对合成训练画像块集合SA2通过贪婪搜索 获取每个测试照片块xi对应的待选择画像块集合

7a)设t=1,θ=2K;

7b)从顺序集合Os中选出与求解顺序oi中第t个值相同的所有稀疏表示cj, 并将这些选出的稀疏表示记为集合并用值替代稀疏表示集合Cs,再判断 中稀疏表示的个数T:如果0<T≤θ,则转到步骤7e),如果T=0,则保留替 代前的稀疏表示集合Cs,并转到步骤7e),如果T>θ,则转到步骤7c);

7c)从稀疏系数值集合Vs中选出与稀疏系数值vi中第t个值欧式距离最相近 的1/9稀疏表示cj,并将这些选出的稀疏表示记为集合并用值替代稀疏 表示集合Cs,再判断中稀疏表示的个数T:如果0<T≤θ,则转到步骤7e), 如果T=0,则保留替代前的稀疏表示集合Cs,并转到步骤7e),如果T>θ,则 转到步骤7d);

7d)令t=t+1,返回步骤7b);

7e)将稀疏表示集合Cs中所有T个稀疏表示对应的合成训练画像块集合SA2中的T个画像块作为稀疏表示ci对应的测试照片块xi的待选择画像块集合 {yi,1,yi,2,…,yi,T}:如果T<K,则利用复制操作将待选择画像块从T个增加到K个, 如果T>K,则利用测试照片块xi的高频信息与待选择画像块的高频信息的欧式 距离将待选择画像块从T个减少为K个,使待选择画像块集合从{yi,1,yi,2,…,yi,T} 变成y~i={yi,1,yi,2,...,yi,K}.

上述方案中,所述将查找到的图像块合成得到初始合成图像,具体为:根 据求解马尔可夫随机场模型从待选择画像块集合中得到每个测试照片块xi最 终对应的训练画像块,并将这些训练画像块进行融合得到与测试照片T对应的 初始合成画像St,t=0。

上述方案中,所述将对所述目标画像,测试照片以及初始合成图像进行分 块得到第三图像块子集,将所述测试照片分块后得到的图像块在第三图像块子 集内根据图像块的多尺度特征查找匹配的图像块,将所述查找到的图像块构成 新合成图像,具体为:提取初始合成画像St、测试照片T以及训练画像A的像 素值特征以及SURF特征,提取初始合成画像St、测试照片T以及训练画像A的 多尺度特征的投影系数,获取测试照片块xl对应的待选择画像块集合根据 所述待选择画像块集合获取新合成画像。

上述方案中,所述将新合成图像替代初始合成图像,重复迭代上述步骤合 成最终合成图像,具体为:新合成画像代替初始合成画像,迭代执行提取初始 合成画像St、测试照片T以及训练画像A的像素值特征以及SURF特征,提取 初始合成画像St、测试照片T以及训练画像A的多尺度特征的投影系数,获取 测试照片块xl对应的待选择画像块集合根据所述待选择画像块集合获取 新合成画像,直到迭代次数达到指定值m时停止,则新合成画像St,t=m,为 最终合成画像。

与现有技术相比,本发明的有益效果:

第一,本发明由于只需要单张目标画像作为训练集,从而省去费时费力的 收集大量照片与画像对的过程,因此能方便的合成各种风格的画像;

第二,本发明由于采用全局搜索来寻找近邻,因此能很好的合成眼镜、发 卡等非人脸部件;

第三,本发明由于用稀疏表示中的稀疏系数值及稀疏系数值被求解的顺序 这两个量来寻找近邻块,因此能有效的匹配拥有不同背景的图像块,从而有效 解决测试照片与训练集照片背景不同的问题。

附图说明

图1为本发明的实现流程图;

图2为三种不同类型的画像;

图3为本发明与现有的三类方法在CUHK student数据库、AR数据库和 XM2VTS数据库上的合成画像的对比结果图;

图4为本发明用三种不同类型的画像作为训练集时在CUHK student数据 库、AR数据库和XM2VTS数据库上的合成画像的对比结果图。

图5为本发明用三种不同类型的画像作为训练集时在网上下载的合照上的 合成画像的对比结果图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

本发明实施例提供一种基于单张目标画像的人脸画像合成方法,图1所示, 该合成方法为:在数据库样本集内随机选择一对照片与画像对中的画像作为目 标画像,其他剩余照片与画像对中的照片作为测试照片样本集,将对所述目标 画像进行分块后得到的图像块进行划分获得第一图像块子集和第二图像块子 集,将所述获得的第一图像块子集进行矩阵分解得到投影矩阵,将所述第二图 像块子集投影到投影矩阵得到第一投影系数集合;然后将从测试照片样本集中 选择的测试照片分块后得到的图像块投影到投影矩阵得到第二投影系数集合, 根据相似性尺度距离所述第二投影系数集合在第一投影系数集合中查找到距离 最近的前K个系数,根据获得的前K个系数在第二图像块子集查找到匹配的图 像块,将查找到的图像块合成得到初始合成图像;将对所述目标画像,测试照 片以及初始合成图像进行分块得到第三图像块子集,将所述测试照片分块后得 到的图像块在第三图像块子集内根据图像块的多尺度特征查找匹配的图像块, 将所述查找到的图像块构成新合成图像,将新合成图像替代初始合成图像,重 复迭代上述步骤合成最终合成图像。

所述在数据库样本集内随机选择一对照片与画像对中的画像作为目标画 像,其他剩余照片与画像对中的照片作为测试照片样本集,具体为:将CUFS 数据库中所有照片与画像对中的图像由彩色图像变成灰度图像,再从照片与画 像对集合中选择一对照片与画像中的画像作为训练画像A,再将剩下的照片与 画像对中的所有照片作为测试照片样本集B,并从测试照片样本集B中选取一 张测试照片T。

所述在数据库样本集内随机选择一对照片与画像对中的画像作为目标画 像,其他剩余照片与画像对中的照片作为测试照片样本集,之后,该方法还包 括:对目标画像的多尺度特征进行主成分分析来获取目标画像的多尺度特征的 主成分。

所述将对所述目标画像进行分块后得到的图像块进行划分获得第一图像块 子集和第二图像块子集,具体为:

3a)对训练画像A建立n层高斯金字塔,高斯金字塔中的每一层都对应着某 个尺度下的画像对:

3a1)构造尺度值为σ的高斯函数:

G(x,y,σ)=12πσ2e-(x2+y2)

其中,G(x,y,σ)表示在σ尺度值下的高斯函数,x,y分别表示图像中像 素点对应的横、纵坐标值;

3a2)将图像与3a1)所得的高斯函数进行卷积,得到高斯金字塔第一层的图 像;

3a3)设i=1;

3a4)将尺度值σ乘以一个比例系数i+1作为新的尺度因子来卷积原图像, 再将卷积后的图像做比例因子为2i的降采样,得到高斯金字塔第i+1层的图像;

3a5)设i=i+1;

3a6)重复步骤3a4)-3a5)n-2次,即可得到n层高斯金字塔;

3b)将高斯金字塔中奇数层对应的画像设为字典训练样本集A1,将高斯金 字塔中偶数层对应的画像设为合成训练样本集A2;

3c)将字典训练样本集A1和合成训练样本集A2中所有的画像划分为相同 大小及相同重叠程度的块,从而分别得到字典训练画像块集合SA1即第一图像块 子集和合成训练画像块集合SA2即第二图像块子集。

所述将所述获得的第一图像块子集进行矩阵分解得到投影矩阵,具体为:

4a)对字典训练画像块集合SA1即第一图像块子集利用有效稀疏编码方法得 到训练画像块特征字典Ds

4a1)初始化训练画像块特征字典为高斯矩阵,并将高斯矩阵每一个 列向量归一化为单位向量;其中,d表示训练画像块特征字典Ds中字典元素的 维数,n表示训练画像块特征字典Ds中字典元素的个数;

4a2)给定字典训练画像块集合SA1以及初始化训练画像块特征字典Ds,按 照下式得到字典训练画像块集合SA1的初始稀疏表示集合C:

C=arg{min||SA1-DsC||22||C||1}

其中,λ是正则化参数,设值为0.15,||·||2表示2范数,||·||1表示1范数, 当给定Ds时,C可以通过特征符号搜索算法进行求解;

4a3)给定字典训练画像块集合SA1以及由步骤4a2)得到的初始稀疏表示集 合C,按照下式得到估计的训练画像块特征字典Ds

Ds=arg{min||SA1-DsC||22},

s.t.||Dsi||221,i=1,...,n

当给定C时,通过拉格朗日对偶方法求解出Ds

4a4)交替迭代步骤4a2)和步骤4a3),直到以下目标函数收敛,得到最终的 训练画像块特征字典Ds

minDs,C||SA1-DsC||22+λ||C||1,

s.t.||Dsi||221,i=1,...,n.

所述的有效稀疏编码方法,见文献“Lee H,BattleA,RainaR,et al.Efficient  sparse coding algorithms[C]//Advances inneural informationprocessing systems. 2006:801-808.”,文献中包含了特征符号搜索算法和拉格朗日对偶方法。

获取训练画像块特征字典Ds的方法不局限于上述的有效稀疏编码方法,还 可用K-SVD算法,见文献“AharonM,EladM,BrucksteinA.k-svd:An algorithm  for designing overcomplete dictionaries for sparserepresentation[J].Signal  Processing,IEEE Transactions on,2006,54(11):4311-4322.”。

所述将所述第二图像块子集投影到投影矩阵得到第一投影系数集合,具体 为:将合成训练样本集A2中所有的画像划分为相同大小及相同重叠程度的块, 从而得到合成训练画像块集合SA2={y1,…,yj,…,yN}即第二图像块子集;

5a)给定训练画像块yj和训练画像块特征字典Ds

5b)构造以下最优化问题来求解训练画像块yj对应的稀疏表示cj

从而得到合成训练画像块集合SA2对应的稀 疏表示集合Cs,其中,λ是正则化参数,设值为0.15,上述最优化问题可利用 最小角回归方法进行求解。

最小角回归方法见文献“Efron B,Hastie T,Johnstone I,et al.Least angle  regression[J].The Annals ofstatistics,2004,32(2):407-499.”;

5c)对合成训练画像块集合SA2即第二图像块子集中的每个训练画像块yj重复步骤5a)和5b),得到合成训练画像块集合SA2对应的稀疏表示集合即第一投 影系数集合:

Cs={c1,…,cj,…,cN}。

其中,cj表示第j个画像块yj的稀疏表示,由于每个稀疏表示cj都包含稀疏 系数值vj以及稀疏系数值在稀疏编码中被求解的顺序oj,因此稀疏表示集合Cs包含有稀疏系数值集合Vs以及对应的稀疏系数值在稀疏编码中被求解的顺序集 合Os,其表示如下:

Vs={v1,…,vj,…,vN};

Os={o1,…,oj,…,oN}。

所述将从测试照片样本集中选择的测试照片分块后得到的图像块投影到投 影矩阵得到第二投影系数集合,具体为:

6a)将测试照片T划分为相同大小及相同重叠程度的测试照片块集合: P={x1,…,xi,…,xM},xi表示测试照片T中的第i个照片块;

6b)将每个测试照片块xi用训练画像块特征字典Ds进行稀疏编码,得到xi对应的稀疏表示ci即第二投影系数集合;

其中,ci表示第i个测试照片块xi的稀疏表示,每个稀疏表示ci都包含稀疏 系数值vi以及稀疏系数值在稀疏编码中被求解的顺序oi

所述根据相似性尺度距离所述第二投影系数集合在第一投影系数集合中查 找到距离最近的前K个系数,根据获得的前K个系数在第二图像块子集查找到 匹配的图像块,具体为:对合成训练画像块集合SA2通过贪婪搜索获取每个测试 照片块xi对应的待选择画像块集合

7a)设t=1,θ=2K;

7b)从顺序集合Os中选出与求解顺序oi中第t个值相同的所有稀疏表示cj, 并将这些选出的稀疏表示记为集合并用值替代稀疏表示集合Cs,再判断 中稀疏表示的个数T:如果0<T≤θ,则转到步骤7e),如果T=0,则保留替 代前的稀疏表示集合Cs,并转到步骤7e),如果T>θ,则转到步骤7c);

7c)从稀疏系数值集合Vs中选出与稀疏系数值vi中第t个值欧式距离最相近 的1/9稀疏表示cj,并将这些选出的稀疏表示记为集合并用值替代稀疏 表示集合Cs,再判断中稀疏表示的个数T:如果0<T≤θ,则转到步骤7e), 如果T=0,则保留替代前的稀疏表示集合Cs,并转到步骤7e),如果T>θ,则 转到步骤7d);

7d)令t=t+1,返回步骤7b);

7e)将稀疏表示集合Cs中所有T个稀疏表示对应的合成训练画像块集合SA2中的T个画像块作为稀疏表示ci对应的测试照片块xi的待选择画像块集合 {yi,1,yi,2,…,yi,T}:如果T<K,则利用复制操作将待选择画像块从T个增加到K个, 如果T>K,则利用测试照片块xi的高频信息与待选择画像块的高频信息的欧式 距离将待选择画像块从T个减少为K个,使待选择画像块集合从{yi,1,yi,2,…,yi,T} 变成y~i={yi,1,yi,2,...,yi,K}.

所述将查找到的图像块合成得到初始合成图像,具体为:根据求解马尔可 夫随机场模型从待选择画像块集合中得到每个测试照片块xi最终对应的训练 画像块,并将这些训练画像块进行融合得到与测试照片T对应的初始合成画像 St,t=0;

所述将对所述目标画像,测试照片以及初始合成图像进行分块得到第三图 像块子集,将所述测试照片分块后得到的图像块在第三图像块子集内根据图像 块的多尺度特征查找匹配的图像块,将所述查找到的图像块构成新合成图像, 具体为:提取初始合成画像St、测试照片T以及训练画像A的像素值特征以及 SURF特征,提取初始合成画像St、测试照片T以及训练画像A的多尺度特征的 投影系数,获取测试照片块xl对应的待选择画像块集合根据所述待选择画 像块集合获取新合成画像。

所述提取合成画像St、测试照片T以及训练画像A的像素值特征以及SURF 特征,具体为

9a)将合成画像St划分为相同大小及相同重叠程度的画像块集合: Z={z1,…,zl,…,zM},zl表示合成画像St中的第l个画像块;

9b)将测试照片T划分为相同大小及相同重叠程度的测试照片块集合: P={x1,…,xl,…,xM},xl表示测试照片T中的第l个照片块;

9c)将训练画像A划分为相同大小及相同重叠程度的训练画像块集合: S={y1,…,yl,…,yN},yl表示训练画像A中的第l个画像块;

9d)对画像块集合Z中的每个块提取像素值特征和SURF特征;

9e)对测试照片块集合P中的每个块提取像素值特征和SURF特征;

9f)对训练画像块集合S中的每个块提取像素值特征和SURF特征;

所述提取合成画像St、测试照片T以及训练画像A的多尺度特征的投影系 数,具体为:

10a)对合成画像St建立高斯金字塔G和拉普拉斯金字塔L,再对高斯金字 塔G的每层画像求解水平一阶导数h1和二阶导数h2以及竖直一阶导数v1和二 阶导数v2。因此,合成画像St拥有6个多尺度特征:合成画像St的高斯金字塔 GS,合成画像St的拉普拉斯金字塔LS,合成画像St的水平一阶导数金字塔H1S, 合成画像St的水平二阶导数金字塔H2S,合成画像St的竖直一阶导数金字塔 V1S,合成画像St的竖直二阶导数金字塔V2S

10b)对训练画像A建立高斯金字塔G和拉普拉斯金字塔L,再对高斯金字 塔G的每层画像求解水平一阶导数h1和二阶导数h2以及竖直一阶导数v1和二 阶导数v2。因此,训练画像A拥有6个多尺度特征:训练画像A的高斯金字塔GA, 训练画像A的拉普拉斯金字塔LA,训练画像A的水平一阶导数金字塔H1A,训 练画像A的水平二阶导数金字塔H2A,训练画像A的竖直一阶导数金字塔V1A, 训练画像A的竖直二阶导数金字塔V2A

10c)对测试照片T建立高斯金字塔G和拉普拉斯金字塔L,再对高斯金字 塔G的每层照片求解水平一阶导数h1和二阶导数h2以及竖直一阶导数v1和二 阶导数v2。因此,测试照片T拥有6个多尺度特征:测试照片T的高斯金字塔GT, 测试照片T的拉普拉斯金字塔LT,测试照片T的水平一阶导数金字塔H1T,测试 照片T的水平二阶导数金字塔H2T,测试照片T的竖直一阶导数金字塔V1T,测 试照片T的竖直二阶导数金字塔V2T

10d)将步骤10a)-10c)中的各多尺度特征投影到步骤2中的主成分以获取各 多尺度特征的投影系数;

所述获取测试照片块xl对应的待选择画像块集合具体为:

11a)将每个测试照片块xl从测试照片块集合P={x1,…,xi,…,xM}中利用像素 值特征搜索求得K个最近邻;则画像块集合Z={z1,…,zl,…,zM}中K个对应的画像 块zl即为搜索得到的待选择画像块;

11b)将每个测试照片块xl从训练画像块集合S={y1,…,yl,…,yN}中利用多尺 度特征的投影系数搜索求得K个最近邻;

11c)将每个测试照片块xl对应的画像块zl从训练画像块集合 S={y1,…,yl,…,yN}中利用多尺度特征的投影系数搜索求得K个最近邻;

11d)对于每个测试照片块xl,当测试照片块xl的高频分量大于某个指定值 时,将测试照片块xl在步骤11a)-11c)中获得的3K个最近邻利用测试照片块xl的 各特征和3K个最近邻的各特征的欧式距离进行最优化重新排序:

11d1)利用提取的图像块多尺度特征的投影系数以及图像块像素值特征和 SURF特征,先求解每个测试照片块xl与3K个最近邻对应特征的欧式距离:

distk=[dtk,1,…,dtk,l,…,dtk,L],k=1,…,3K;

其中,dtk,l表示测试照片块xl与第k个近邻画像块在第l个特征上的欧式距 离,L表示图像块所提取的特征个数;

11d2)对步骤11d1)得到的distk,k=1,…,3K,通过求解以下最优化问题得 到测试照片块xl与第k个最近邻所有对应特征的欧式距离distk的权重 μk=[μk,1,…,μk,l,…,μk,L]。

min{distkTμk+12μkTHμk}s.t.Σl=1Lμk,l=1,0μk,l1

其中,H是对角矩阵,对角元素为

11d3)利用步骤11d1)得到的欧式距离distk与步骤11d2)得到的权重μk,按 照得到每个测试照片块xl与3K个最近邻新的距离从而进行重新排序。

11e)对于每个测试照片块xl,当测试照片块xl的高频分量小于等于某个指 定值时,直接将测试照片块xl在测试照片块集合P={x1,…,xi,…,xM}中利用像素值 特征搜索求得3K个最近邻;

所述获取新合成画像,具体为。

从步骤11a)-11e)得到的测试照片块xl对应的3K个最近邻中选择前K个最 近邻,通过求解马尔可夫随机场模型得到每个测试照片块xl最终对应的训练画 像块,然后经过融合得到测试照片T对应的新合成画像St,t=1;

所述将新合成图像替代初始合成图像,重复迭代上述步骤合成最终合成图 像,具体为:新合成画像代替初始合成画像,迭代执行步骤9a)~11e),直到 迭代次数达到指定值m时停止,则新合成画像St,t=m,为最终合成画像。

实验数据:

本发明的效果可以通过以下仿真实验做进一步的说明。

1.仿真条件

本发明是在中央处理器为Intel(R)Core(TM)i3-21003.10GHz、内存4G、 WINDOWS 7操作系统上,运用美国Mathworks公司开发的MATLAB R2013b 进行仿真。

数据库采用CUFS数据库,该数据库包含CUHK student数据库、AR数据 库和XM2VTS数据库。

AR数据库见文献“MartinezAM.TheAR face database[J].CVC Technical  Report,1998,24.”。

XM2VTS数据库见文献“Messer K,Matas J,Kittler J,et al.XM2VTSDB:The  extended M2VTS database[C]//Second international conference on audio and  video-based biometric person authentication.1999,964:965-966.”。

2.仿真内容

取CUHK student数据库中1个男性画像作为训练画像A。测试照片样本集 B则为CUFS数据库当中CUHK student数据库剩下的187张照片、AR数据库 中123张照片和XM2VTS数据库中295张照片。

为了证明本发明能合成多种风格的画像,训练画像A除了取CUFS数据库 中的画像,还从网上下载了两张不同风格的画像作为训练画像A,如图2所示。 其中,图2(1)和图2(2)分别为网上下载的两张不同风格的画像,图2(3)为CUHK  student数据库中1个男性画像。

利用本发明和现有基于局部线性的方法LLE、基于马尔可夫随机场模型的 方法MRF以及基于马尔可夫权重场模型的方法MWF,在CUFS数据库上进行 照片到画像的合成仿真实验,结果如图3所示。其中:

图3(a)为原始照片,

图3(b)为现有基于局部线性的方法LLE合成的画像,

图3(c)为现有基于马尔可夫随机场模型的方法MRF合成的画像,

图3(d)为现有基于马尔可夫权重场模型的方法MWF合成的画像,

图3(e)为本发明方法用图2(3)作为训练画像A时合成的画像。

由图3实验结果可见,图3(b)~图3(d)中的第一张画像都没有发卡,第二张 画像都没有刘海,其余的四张画像都没有眼镜,而且图3(b)~图3(d)中的第三张 画像到第六张画像的背景都存在噪声。而图3(e)所示的本发明的第一张画像有 发卡,第二张画像有刘海,其余的四张画像有眼镜,而且所有合成画像的背景 都很干净。

在用图2中的三种不同风格的画像依次作为训练画像A的情况下,本发明 方法在CUFS数据库上进行照片到画像的合成仿真实验,结果如图4所示。其 中:

图4(a)为原始照片,

图4(b)为本发明方法用图2(1)作为训练画像A时合成的画像,

图4(c)为本发明方法用图2(2)作为训练画像A时合成的画像,

图4(d)为本发明方法用图2(3)作为训练画像A时合成的画像。

由图4实验结果可见,图4(b)的风格与图2(1)相似,图4(c)的风格与图2(2) 相似,图4(d)的风格与图2(3)相似,此外图4(b)~图4(d)所示的本发明的第一张 画像有发卡,第二张画像有刘海,其余的四张画像有眼镜,而且所有合成画像 的背景都很干净。

在用图2中的三种不同风格的画像依次作为训练画像A的情况下,本发明 方法在网上下载的合照上进行照片到画像的合成仿真实验,结果如图5所示。 其中:

图5(a)为原始照片,

图5(b)为本发明方法用图2(1)作为训练画像A时合成的画像,

图5(c)为本发明方法用图2(2)作为训练画像A时合成的画像,

图5(d)为本发明方法用图2(3)作为训练画像A时合成的画像。

由图5实验结果可见,图5(b)的风格与图2(1)相似,图5(c)的风格与图2(2) 相似,图5(d)的风格与图2(3)相似,此外图5(b)~图5(d)所示的本发明的合成画 像均不受测试图像的大小以及人脸数量的影响。

综上所述:本发明由于在用多尺度金字塔作为特征时借助了迭代的思想, 并在以稀疏表示中稀疏系数值和稀疏系数值在稀疏编码中被求解的顺序作为特 征的情况下,利用贪婪搜索的方法,使得在以单张目标画像作为训练集的情况 下,在测试照片与训练集照片背景不同时,能忽略背景的影响而合成测试照片 对应的画像;在测试照片中存在训练集照片中都不存在的非人脸部件时,能对 测试照片合成包括非人脸部件在内的对应画像;此外,还能忽略训练画像的风 格和测试照片的大小以及测试照片中所包容的人脸数目等因素进行画像合成, 验证了本发明的实用性。

以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范 围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号