首页> 中国专利> 一种基于双图正则化约束和字典学习的图像自动标注方法

一种基于双图正则化约束和字典学习的图像自动标注方法

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明提供一种基于双图正则化约束和字典学习的图像自动标注方法，包括以下步骤：根据图像训练集和测试集提取图像特征，得到图像特征集X；采用汉明损失和高斯核函数计算图像间相似度权重Wi,j，得到特征空间正则化图LC；构建初始稀疏字典D，并对图像特征集X进行稀疏重构得到初始稀疏编码A；采用凸优化工具获得字典原子图LD；基于特征空间正则化图LC约束、字典原子图LD约束及稀疏编码A，交替更新得到最优稀疏字典D和分类器W；根据最优稀疏字典D进行特征重构，自适应扩大分类权重并利用分类器W进行标签概率预测，根据标签预测概率进行图像的自动标注。本发明能够有效的关联特征之间和标签之间的高维联系，具有良好的准确性、泛用性和适应性。

著录项

公开/公告号CN112487231A

专利类型发明专利
公开/公告日2021-03-12

原文格式PDF
申请/专利权人中国矿业大学(北京);
展开▼

申请/专利号CN202011493799.4
发明设计人王振武;
展开▼

申请日2020-12-17
分类号G06F16/58(20190101);G06F16/55(20190101);
代理机构11562 北京东方盛凡知识产权代理事务所(普通合伙);
代理人王颖
地址 100083 北京市海淀区学院路丁11号
入库时间 2023-06-19 10:11:51

说明书

技术领域

本发明属于图像检索技术领域，具体涉及一种基于双图正则化约束和字典学习的图像自动标注方法。

背景技术

随着数码相机和电子设备的逐渐流行，各种图像的数量正在快速增加。对于图像检索，用户习惯于采用关键字等方式进行检索，但是人工的对图像进行标注的方法不但工作量大，而且不可避免地带来主观性和不精确性，让计算机实现图像自动标注势在必行。

图像自动标注是让计算机自动地给图像加上能够反映其内容的语义关键词，自动标注的使用可以有效地改善目前图像检索的困境。

使用包含样本原子在内的过完备字典，样本由过完备字典原子的稀疏线性组合表示，这是字典学习核心思想。目前研究活动主要集中在根据给定字典分解样本的跟踪算法，通过从一组预先指定的线性变换中选择一个或使字典适应一组训练信号，可以设计更符合上述模型的字典。这就直接指出了字典学习的两个过程：训练字典和稀疏编码。字典学习能够有效的关联特征与特征之间，标签与标签之间的高维联系。

因此，提供一种基于字典学习的自动化的图像标注方法是非常有必要的。

发明内容

针对现有技术存在的问题，本发明提供了一种基于双图正则化约束和字典学习的图像自动标注方法，通过使用特征空间和字典原子空间的拉普拉斯正则化图，通过交替迭代算法求得最优的稀疏字典，使用最优稀疏字典进行特征重构，使用分类器进行标签概率预测，基于标签预测概率构造图像预测标签集，实现图像的自动标注，具有较强的准确性和适用性。

为达到上述目的，本发明提出如下技术方案，本发明提供一种基于双图正则化约束和字典学习的图像自动标注方法，包括以下步骤：

S1、构建图像测试集和训练接，根据图像训练集和测试集提取图像特征，得到图像特征集X；

S2、采用汉明损失和高斯核函数计算图像间相似度权重W

S3、构建初始稀疏字典D

S4、采用凸优化工具获得字典原子图L

S5、根据最优稀疏字典D进行特征重构，自适应扩大分类权重并利用分类器W进行标签概率预测，根据标签预测概率进行图像的自动标注。

优选地，所述测试集和所述训练集分别包含若干个特征向量x

优选地，所述步骤S2的具体过程为：

S2.1、根据汉明损失计算图像离散特征间相似度的权重

S2.2、根据高斯核函数计算图像连续特征间相似度的权重

S2.3、根据图像离散特征间相似度的权重

S2.4、根据图像间的相似度的权重W

优选地，所述步骤S3的具体过程为：

S3.1、获得初始化的稀疏编码A

S3.2、对稀疏编码A

S3.3对误差变量Z

优选地，所述步骤S4的具体过程为：

S4.1、初始化字典D

S4.2、根据稀疏限制T

S4.3、获得当前更新字典原子项d

S4.4、根据步骤S4.2对字典原子编码权重d

优选地，所述对字典原子编码权重d

优选地，所述步骤S5的具体过程为：

S5.1、采用最优稀疏字典D对测试集进行稀疏重构，得到稀疏编码

S5.2、根据稀疏限制T

S5.3、采用稀疏编码A

S5.4、计算训练集中属于某个标签的图像的标签集的平均长度

S5.5、根据预测概率向量

本发明公开了以下技术效果：

本发明通过使用特征空间和特征属性空间的拉普拉斯正则化图，通过交替迭代算法求得最优的稀疏字典，使用最优稀疏字典进行特征重构，能够有效的关联特征和特征之间，标签和标签之间的高维联系；使用分类器进行标签概率预测；基于标签预测概率构造图像预测标签集，实现图像的自动标注，具有较强的准确性；同时本发明能够标注所有类型的图像，具有较强的泛用性；本发明还能够处理包含连续特征和离散特征的图像，具有较强的适应性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见的，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明基于双图正则化和字典学习的图像自动标注方法流程示意图：

图2为本发明的特征空间正则化图L

图3为本发明的稀疏编码A的计算流程示意图；

图4为本发明的最优稀疏字典D和分类器W的计算流程示意图；

图5为本发明构建图像预测标签集的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1所示，本发明提供一种基于双图正则化和字典学习的图像自动标注方法，包括以下步骤：

S1、构建图像测试集和训练接，根据图像训练集和测试集提取图像特征，得到图像特征集X；

本实施例提取M幅图像的特征构成训练集X

其中：图像特征集X＝(x

其中任意

设稀疏字典

S2、采用汉明损失和高斯核函数计算图像间相似度权重W

S2.1、基于汉明损失构造x

S2.2、基于高斯核函数构造x

其中：

S2.3、对式(1)和式(2)中的

S2.4、基于相似度权重W

其中：

S3、构建初始稀疏字典D

S3.1、初始化稀疏编码

S3.2、在稀疏编码的第k次更新中，以(D

S3.3、更新

S3.4、更新U

S3.5、更新Ω

得到最终的Z

S4、采用凸优化工具获得字典原子图L

S4.1、本实施例采用凸优化CVX工具计算字典原子图L

由此，存在约束L

其中：α是字典原子图的权重参数；Tr(·)是迹函数；||·||

通过特征空间图约束和字典原子图约束，确定：

由此，存在约束||a

其中：β是字典原子图权重参数；γ是分类器权重参数。

S4.2、初始化字典

S4.3、在稀疏编码的第k次更新中，根据步骤S3通过字典

S4.4、根据稀疏限制T

S4.5、使用d

S4.6、定义限制算子P

计算误差矩阵，具体为：

其中：

S4.7、更新

更新

S4.8、根据步骤S4.4再次更新字典原子编码权重，得到最终的

S5、使用最优稀疏字典D进行特征重构并自适应扩大分类权重并利用分类器W进行标签概率预测，根据标签预测概率实现图像的自动标注，具体流程如图5所示。

基于稀疏字典D和分类器W预测x

S5.1、使用最优稀疏字典D对测试图像特征X

S5.2、根据稀疏限制T

S5.3、使用稀疏编码A

S5.4、计算X

计算X

S5.5、对

以上所述的实施例仅是对本发明的优选方式进行描述，并非对本发明的范围进行限定，在不脱离本发明设计精神的前提下，本领域普通技术人员对本发明的技术方案做出的各种变形和改进，均应落入本发明权利要求书确定的保护范围内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于双图正则化约束和字典学习的图像自动标注方法 [P] . 中国专利： CN112487231B . 2021.08.27
2. 一种基于双图正则化约束和字典学习的图像自动标注方法 [P] . 中国专利： CN112487231A . 2021-03-12
3. A method for determining a characteristic map for an object, in particular for a living being, based on at least one first image, in particular core pin resonance image [P] . 德国专利： DE102006033383A1 . 2008-01-17

机译：一种用于基于至少一个第一图像，尤其是芯销共振图像确定对象，特别是生物的特征图的方法
4. A MANUFACTURING METHOD FOR MASTER HOLOGRAM OF HOLOGRAPHIC STEREOGRAM HASED ON DIGITAL IMAGES [P] . 韩国专利： KR101429495B1 . 2014-08-13

机译：一种基于数字图像的全息立体图制作方法
5. A method of preparation of a pharmaceutical composition based on 1,3-bis- (2-carboxi-cromon-5-iloxi) -propan-2-ol. (Machine-translation by Google Translate, not legally binding) [P] . ES451471A1 . 1978-06-01

机译：一种基于1，3-双-（2-羧基-cromon-5-iloxi）-丙-2-醇的药物组合物的制备方法。（通过Google翻译进行机器翻译，没有法律约束力）