首页> 中国专利> 基于多任务多示例支持向量机的图像分类方法

基于多任务多示例支持向量机的图像分类方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种基于多任务多示例支持向量机的图像分类方法。该方法包括：为T组图像建立T个学习任务；对T个学习任务的图像进行多示例化；为T个任务中的每个类别的图像构建一个类包；建立类包中的示例到多示例包的欧式距离公式；构建类包到多示例包的示例距离向量；建立类包到多示例包的加权欧式距离公式；约束多示例包到所属类别的距离小于到其他类别的距离；建立多任务多示例支持向量机的优化问题；转换优化问题为传统单任务单示例支持向量机问题；求解支持向量机优化问题。本发明涉及了一种最优化加权欧式距离公式的方法，通过把图像示例化，建立多任务多示例支持向量机学习问题，从而最优化出理想权值，从而提高图像分类器的性能。

著录项

公开/公告号CN106127247A

专利类型发明专利
公开/公告日2016-11-16

原文格式PDF
申请/专利权人广东工业大学;
展开▼

申请/专利号CN201610466376.0
发明设计人阮奕邦;肖燕珊;刘波;郝志峰;黎启祥;
展开▼

申请日2016-06-21
分类号G06K9/62(20060101);G06Q50/00(20120101);
代理机构广东广信君达律师事务所;
代理人杨晓松
地址 510062 广东省广州市越秀区东风东路729号
入库时间 2023-06-19 00:53:35

法律信息

法律状态公告日

法律状态信息

法律状态
2019-07-09

授权

授权
2016-12-14

实质审查的生效 IPC(主分类):G06K9/62 申请日:20160621

实质审查的生效
2016-11-16

公开

公开

说明书

技术领域

本发明涉及图像分类技术领域，特别是涉及基于多任务多示例支持向量机的图像分类方法。

背景技术

随着信息技术的进步与社交网络的长久发展，互联网上面已经存在着海量的图像，并且每天新上传到互联网上的图像数量也呈指数上升，图像所包含的场景也越来越丰富，虽然社交网站得到了长久的发展，但是网站上海量的图片却没有得到充分的利用，并且每天都会有大量新的图像上传到网站上面，如何识别出未被标记的图像，并且准确分类到对应的类别中以更好地服务网站用户，是大部分互联网公司都在研究的一个问题。

一方面，由于在拍摄图像的时候可能会包含各种各样的背景元素，则会导致图像不仅仅包含一个场景，如果采用传统的单示例图像识别方法，如单示例支持向量机，可能会导致误分类。例如，在动物园拍摄景物的时候，可能会同时把不同物种拍到同一张图像，如人、马、小鸟等动物都可能会在同一张图像中。

另一方面，由于互联网的开放性以及拍摄设备的多样性，同一个人的照片可能会出现在不同的社交网站上面，或者由不同设备所拍摄，或者由不同的视频所剪辑而来，把这些图片混合一起进行识别，显然是不合理的；再者，为了提高图像分类器的性能，需要大量的有标记的图像来进行分类器的训练，如果训练样本不足，则会导致分类器的性能下降，从而影响图像分类的效果。早期的图像分类都是通过人工标记的形式进行分类，但是这种方法的人工成功会非常高，在少量图像下，或许还可行，但是以互联网现在的图像产生速度，则不太可取。

发明内容

虽然同一类型的已标注的图像在互联网上面的数量很多，但是由于来源方式不同，例如，拍摄的设备或者储存的社交网站不同，把这些图片混合一起进行分类器的训练是不合理的，但是根据来源形式来进行分组训练，则可能会遇到训练样本不足从而导致分类器的精度下降等问题，所以可以采用多任务的形式，把若干组图片同时进行训练，并且利用每组图片的相关性来提高每组图片分类器的性能。而且由于图像含有多个场景，把图像看成单示例来进行处理，则会忽略掉多个场景的相关性，此时可以采用多示例学习方法，把一个图像看成多个示例。

本发明的基于多任务多示例支持向量机的图像分类方法包括如下步骤：

(1)获取若干组的图像，并且保证每组图像的数量不多，以组为单位，建立若干个学习任务，并且以人工标记的形式，进行图像的人工分类。

(2)把所有学习任务的所有图像，转换为多示例数据。

(3)在每个多示例学习任务中，为每个图像类别构建一个相关联的多示例包，该多示例包在本发明中称为类包，并且建立类包中的示例到多示例包的欧式距离公式。

(4)构建类包到多示例包的示例距离向量，从而建立类包到多示例包的加权欧式距离公式。

(5)建立约束，保证多示例包到所属类别的距离要远远小于到其他类别的距离。

(6)建立多任务多示例支持向量机的优化问题。

(7)转换步骤(6)的多任务多示例支持向量机优化问题为一个类似单任务单示例支持向量机的优化问题。

(8)求解步骤(7)的支持向量机优化问题，可以获得最优化的权值，从而训练出一个基于多任务多示例支持向量机的图像分类器，进行图像的分类。

附图说明

图1为本发明的基于最大间距多任务多示例学习的网页分类方法的流程图。

具体实施方式

本发明的基于多任务多示例支持向量机的图像分类方法包括如下步骤：

第一步，获取若干组的图像，并且保证每组图像的数量不多，以组为单位，建立若干个学习任务，并且以人工标记的形式，进行图像的人工分类。例如，如果存在T组图像，则建立T个图像分类器学习任务，而且由于T个任务的图像数量都不多，可以进行人工标记。

第二步，把所有学习任务的所有图像，转换为多示例数据。由于图像含有多个场景，而在分类的时候，只需要其中的一个关键场景，所以此时把整个图像转换为一个单示例来进行分类，可能会忽略掉多个场景的相关性，导致分类效果变差，所以此时可以采用多示例学习方法来进行图像分类。采用多示例学习方法之前，需要对图像进行多示例数据化，可以采用经典的图像切割方法，如本发明采用的Blobworld System，来进行图像的区域化，此时对每个图像区域进行特征提取，从而使该图像区域转换为一个示例。一个图像含有多个区域，则可以转换为多个示例，此时一张图像可以称为一个多示例包。

第三步，在每个多示例学习任务中，为每个图像类别构建一个相关联的多示例包，该多示例包在本发明中称为类包，并且建立类包中的示例到多示例包的欧式距离公式。不像传统的多示例方法，本发明不直接关注图像与图像之间的距离，而是把每个类别的所有图像组合在一起，建立一个类级别的多示例包，简称为类包，并且建立类包中的示例到多示例包的欧式距离公式，如下：

$> {Dist}_{t} (c_{kt}^{j}, B_{it}) = \frac{1}{n_{kt}} {(c_{kt}^{j}, {\bar{b}}_{it})}^{T} (c_{kt}^{i}, {\bar{b}}_{it})$ >

在上式中，示例是类包C_kt的第j个示例，是多示例包B_it的中心。n_kt是类包C_kt的示例个数。

第四步，构建类包到多示例包的示例距离向量，从而建立类包到多示例包的加权欧式距离公式。在第三步中，可以求得每个类包示例到多示例包的距离大小，以该距离大小为向量元素，建立类包到多示例包的示例距离向量，则第t个任务的第k个类别到第i个多示例包的示例距离向量如下：

$> d_{k i}^{t} = {[{Dist}_{t} (c_{k t}^{1}, B_{i t}), ..., {Dist}_{t} (c_{k t}^{j}, B_{i t}), ..., {Dist}_{t} (c_{k t}^{{nk}_{t}}, B_{i t})]}^{T}$ >

建立一个与示例距离向量等长度的权值向量w_kt，该权值向量定义如下：

$> w_{k t} = {[w_{k t}^{1}, ..., w_{k t}^{j}, ..., w_{k t}^{n k t}]}^{T}$ >

将示例距离向量与权值向量w_kt想乘，则可以得到类包到多示例包的加权欧式距离公式：

$> {Dist}_{t} (C_{k t}, B_{i t}) = w_{k t} d_{k i}^{t}$ >

第五步，建立约束，保证多示例包到所属类别的距离要远远小于到其他类别的距离。建立以下约束：

$> \forall p \in P_{t} (B_{i t}), \forall n \in N_{t} (B_{i t}) : w_{n t} d_{n i}^{t} - w_{p t} d_{p i}^{t} \geq 1 - ξ_{i p n}^{t}$ >

上式中，P_t(B_it)为多示例包B_it所属的类别集合，N_t(B_it)为与多示例包B_it无关的类别集合，为误差项，该约束保证了类别n到多示例包B_it的距离要大于类别p到多示例包B_it的距离。

第六步，建立多任务多示例支持向量机的优化问题。在第t个任务中，把所有类别的权值向量组成一个向量w_t，如下：

$> w_{t} = {[w_{1 t}^{T}, ..., w_{k t}^{T}, ..., w_{K t}^{T}]}^{T}$ >

相应的，构建一个等长的向量向量由和-组成，该向量的其他位置填充0，所以可以把第五步中所建立的约束转换为如下的形式：

$> \forall p \in P_{t} (B_{i t}), \forall n \in N_{t} (B_{i t}) : w_{t} d_{i p n}^{t} \geq 1 - ξ_{i p n}^{t}$ >

基于该约束，把w_t转换为多任务学习的形式，即w_t＝w₀+v_t，w₀被认为是所有任务共享的公共权值系数，而v_t是每个任务所则独享的权值系数，为此建立一个多任务多示例支持向量机的优化问题，如下：

$> (\begin{matrix} \min & {Tγ}_{0} | | w_{0} | |^{2} + γ_{1} Σ_{t = 1}^{T} | | v_{t} | |^{2} + C_{w} Σ_{t = 1}^{T} \underset{i, p \in P_{t} (B_{i t}), n \in N_{t} (B_{i t})}{Σ} ξ_{i p n}^{t} \\ s . t . & \forall t, \forall i, \forall p \in P_{t} (B_{i t}), n \in N_{t} (B_{i t}) : \\ (w_{0} + v_{t}) d_{i p n}^{t} \geq 1 - ξ_{i p n}^{t}, \\ ξ_{i p n}^{t} \geq 0, \end{matrix})$ >

上式中，C_w用来控制误差项的大小，正则化参数γ₀和γ₁用来控制多示例学习任务间的相似性。如果γ₀趋向于无穷大，则每个多示例学习任务所训练出来的分类器是不相关的。相反的，如果γ₁趋向于无穷大，则所有多示例学习任务训练出来的分类器是相同或者类似的。

第七步，转第六步的多任务多示例支持向量机优化问题为一个类似单任务单示例支持向量机的优化问题。为了使用二次规划等数值求解技术来解决该多任务多示例支持向量机问题，需要把该问题转换为一个类似传统支持向量机优化问题的形式，因此建立两个向量如下：

$> x_{i p n}^{t} = [\frac{1}{\sqrt{μ}} d_{i p n}^{t}, \frac{0, ..., 0}{t - 1}, d_{i p n}^{t}, \frac{0, ..., 0}{T - t}]$ >

根据以上两个向量，可以把第六步的多任务多示例支持向量机转换为标准的支持向量机优化问题形式，如下：

$> (\begin{matrix} \min & \frac{1}{2} | | w | |^{2} + C_{w} Σ_{t = 1}^{T} \underset{i, p \in P_{t} (B_{i t}), n \in N_{t} (B_{i t})}{Σ} ξ_{i p n}^{t} \\ s . t . & \forall t, \forall i, \forall p \in P_{t} (B_{i t}), n \in N_{t} (B_{i t}) : \\ {wx}_{i p n}^{t} \geq 1 - ξ_{i p n}^{t}, \\ ξ_{i p n}^{t} \geq 0, \end{matrix})$ >

第八步，求解第七步的支持向量机优化问题，可以获得最优化的权值，从而训练出一个基于多任务多示例支持向量机的图像分类器，进行图像的分类。

在不脱离本发明精神或必要特性的情况下，可以其它特定形式来体现本发明。应将所述具体实施例各方面仅视为解说性而非限制性。因此，本发明的范畴如随附申请专利范围所示而非如前述说明所示。所有落在申请专利范围的等效意义及范围内的变更应视为落在申请专利范围的范畴内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于多任务多示例支持向量机的图像分类方法 [P] . 中国专利： CN106127247B . 2019.07.09
2. 基于度量学习和多示例支持向量机的图像分类方法 [P] . 中国专利： CN109165673B . 2021.08.31
3. METHOD FOR CLASSIFYING HIGH-DIMENSIONAL IMBALANCED DATA BASED ON SVM [P] . 世界知识产权组织专利： WO2019041629A1 . 2019-03-07

机译：基于支持向量机的高维不平衡数据分类方法
4. METHOD AND SYSTEM FOR EXTRACTING AND CLASSIFYING SOUND FEATURES BASED ON SUPPORT VECTOR MACHINE FOR UAV SOUND IDENTIFICATION [P] . 韩国专利： KR20190019713A . 2019-02-27

机译：基于支持向量机的无人机声音特征提取与分类方法及系统
5. CLASSIFICATION METHOD BASED ON SUPPORT VECTOR MACHINE [P] . 韩国专利： KR101905129B1 . 2018-11-28

机译：基于支持向量机的分类方法