首页> 中国专利> 一种基于“视角-标记”贡献度和一致性的多视角多标记分类方法

一种基于“视角-标记”贡献度和一致性的多视角多标记分类方法

摘要

本发明公开了一种基于“视角‑标记”贡献度和一致性的多视角多标记分类方法,属于机器学习技术领域。本发明通过矩阵分解技术对原始标记空间进行降维,同时利用流形正则约束相似样本在低维潜在标记空间中具有相似的标记值;构建从每个视角数据到低维潜在标记空间的线性分类模型;在线性分类模型的基础上,根据各视角线性分类模型的预测损失,学习各视角对每个类别标记的贡献度,即“视角‑标记”贡献度;根据“视角‑标记”贡献度,计算任意两个视角在同一标记上的预测一致性,即“视角‑标记”一致性权重,并据此约束不同视角分类模型在对应类别标记的预测结果一致性程度,提升了多视角多标记数据分类模型的性能。

著录项

  • 公开/公告号CN112329842A

    专利类型发明专利

  • 公开/公告日2021-02-05

    原文格式PDF

  • 申请/专利权人 安徽工业大学;

    申请/专利号CN202011209117.2

  • 申请日2020-11-03

  • 分类号G06K9/62(20060101);G06N20/00(20190101);

  • 代理机构34134 安徽知问律师事务所;

  • 代理人平静

  • 地址 243002 安徽省马鞍山市湖东路59号

  • 入库时间 2023-06-19 09:49:27

说明书

技术领域

本发明涉及机器学习技术领域,更具体地说,涉及一种基于“视角-标记”贡献度和一致性的多视角多标记分类方法。

背景技术

随着科学技术的发展,数据的获取与收集变得越来越容易,但海量的数据以及数据的高维特性也给机器学习和数据挖掘任务带来了巨大挑战。一方面,一个对象可以由多种视角特征数据来表示;另一方面,一个对象可以同时与多个类别标记相关联。例如在图像分类中,图片中包含多个物体(类别标记),可以通过对图片提取并利用多种特征描述提升预测性能,诸如此类问题可描述为多视角多标记学习。多视角多标记学习的关键在于如何充分利用不同视角数据和多个类别标记之间的关联性,从而构建有效的学习模型以预测未知示例的相关标记。在多视角多标记学习中,不同的视角数据对不同类别标记的贡献度存在差异性,如果仍以全局方式对基于不同视角数据的预测结果的一致性加以约束,则并不利于模型分类性能的提升,因此在“视角-标记”一致性层面上构建分类模型显得尤为重要。

现有的多视角多标记学习方法可以分为两大类:前端融合和后端融合。前端融合策略通常为先为所有视角数据特征空间学习一个共享子空间,然后构建多标记分类模型,主要包括了基于矩阵分解技术空间学习、多核学习以及数据简单拼接然后利用

综上所述,一方面,不同视角数据对每个类别标记的贡献度不同,并且每个视角数据的不同特征对每个类别标记的判别性也不同;另一方面,随着大数据的出现,在一些领域里,标记空间的维度可能会非常高,标记空间的高维性将会增加多标记学习模型训练阶段和预测阶段的时间复杂度和空间复杂度,同时标记空间维数过高还会带来噪声问题,这也会影响多标记学习性能。因此,对标记空间进行维度约减,在低维潜在标记空间中学习每个视角数据对类别标记的贡献度并构建“视角-标记”一致性分类模型,将会更好的进行多视角多标记学习任务。

经检索,中国专利申请号:201910226726.X,申请日为:2019年3月25日,发明名称为:一种基于视角类属特征学习的多视角多标记分类方法,该申请案,包括:S1、获取训练数据,建立类别标记矩阵;S2、构建类别标记后各视角特征数据映射到类别标记矩阵的线性模型;S3、在线性模型基础上,建立各视角特征贡献度模型;S4、采用正则项约束视角特征贡献度模型,使每个视角特征数据在预测结果上具有一致性;S5、采用流行正则约束相关类别标记对应的模型系数的相似性;S6、标记预测,给定一个测试样本t,将测试样本t带入步骤S1-S5中得融合预测值。本申请的技术方案实现有效利用多源信息,学习每个视角中不同特征对类别标记的判别性能,更好的进行多标记学习任务。但该申请案将所有类别标记作为一个整体来考虑,对所有类别标记只学习一个贡献度权重,未充分考虑单个视角数据对不同类别标记的判别力,从而影响最终分类性能;其次,该申请案在原始标记空间上直接学习视角贡献度,空间和时间复杂度较大,分类性能较差。

发明内容

1.发明要解决的技术问题

鉴于现有的多视角多类别标记方法具有较高的时间复杂度和空间复杂度,且忽视不同不同特征对每个类别标记的判别性,导致多标记学习性能不高的问题本发明提供了一种基于“视角-标记”贡献度和一致性的多视角多标记分类方法,对标记空间进行维度约减,学习低维潜在标记空间中各视角数据对每个类别标记的贡献度,构建“视角-标记”一致性分类模型,提升了分类模型的性能。

2.技术方案

为达到上述目的,本发明提供的技术方案为:

本发明的一种基于“视角-标记”贡献度和一致性的多视角多标记分类方法,其步骤为:

步骤一、获取多视角训练数据,将训练数据进行类别标记为

步骤二、利用矩阵分解技术将原始类别标记矩阵Y∈R

步骤三、基于每个视角数据的特征表示X

步骤四、在线性分类模型的基础上,根据各视角线性分类模型的预测损失,学习各视角对每个类别标记的贡献度;

步骤五、根据步骤四得到的贡献度,计算任意两个视角在同一标记上的预测一致性,并约束不同视角分类模型在对应类别标记的预测结果一致性程度,获得最终的分类模型;

步骤六、标记预测,给定一个测试样本t,将t带入经步骤一至五学习得到的多视角多标记线性分类模型中,并对它们的分类结果采用两阶段融合策略,得到最终预测结果。

3.有益效果

(1)鉴于现有的多视角多类别标记方法忽视不同特征对每个类别标记的判别性,导致不同视角数据在同一个类别标记预测可能不一致,且标记空间的高维性将会增加多标记学习模型训练阶段和预测阶段的时间复杂度和空间复杂度,对多标记学习性能造成的问题,本发明提供了一种基于“视角-标记”贡献度和一致性的多视角多标记分类方法,对标记空间进行维度约减,学习低维潜在标记空间中各视角数据对每个类别标记的贡献度,利用具有相似贡献度权重的视角在标记预测上也具有相似性的特点,构建“视角-标记”一致性分类模型,提升了分类模型的性能。

(2)本发明首次提出从“视角-标记”角度解决多视角多标记分类问题,首先将原始标记空间映射到一个更低维的潜在标记空间,然后在此低维潜在标记空间中学习每个视角数据对类别标记的“视角-标记”贡献度,并构建“视角-标记”一致性分类模型。利用学习到的“视角-标记”贡献度,通过两阶段融合策略,有效融合多源信息,提升多视角多标记数据分类模型的性能。同时,通过对原始标记空间降维,大大降低模型的空间和时间复杂度,可用于处理大规模多视角多标记数据。

附图说明

图1为本发明的多视角多标记分类方法框图。

具体实施方式

本发明提供一种基于“视角-标记”贡献度和一致性的多视角多标记分类方法,实现有效利用多源信息,首先对标记空间进行维度约减,学习低维潜在标记空间中各视角数据对每个类别标记的贡献度,然后利用具有相似贡献度权重的视角在标记预测上也具有相似性的特点,构建“视角-标记”一致性分类模型,提升分类性能。

为进一步了解本发明的内容,结合附图和实施例对本发明作详细描述。

实施例1

结合图1,本实施例的一种“视角-标记”贡献度和一致性的多视角多标记分类方法,包括模型构建与训练和标记预测两个阶段。

(1)模型构建与训练

步骤一、获取多视角训练数据,并将训练数据进行类别标记,建立类别标记矩阵。具体为:

假定获取的多视角训练数据中有m种特征表示

步骤二、通过矩阵分解技术对原始标记空间进行降维,将原始标记空间映射到一个更低维的潜在标记空间中,同时利用流行正则约束低维潜在标记空间中相似样本具有相似的标记值。具体为:

将原始类别标记矩阵Y∈R

其中U和V为待求解的模型参数,λ

步骤三、构建从每个视角数据到低维潜在标记空间的多元线性回归模型。具体为:

基于任意第v种视角特征表示X

其中

步骤四、在线性分类模型的基础上,根据各视角线性分类模型的预测损失,学习各视角对每个类别标记的贡献度,即“视角-标记”贡献度。具体为:

定义Θ∈R

其中

步骤五、根据“视角-标记”贡献度,计算任意两个视角在同一标记上的预测一致性,即“视角-标记”一致性权重,并据此约束不同视角分类模型在对应类别标记的预测结果一致性程度。具体为:

其中

式(4)经过数学运算可以得到最小化目标公式如下所示:

其中

(2)标记预测

步骤六、标记预测,给定一个测试样本t,将t带入经步骤一至五学习得到的多视角多标记线性分类模型中,并对它们的分类结果采用两阶段融合策略,得到最终预测结果。具体为:

给定一个测试样本t,该测试样本的第m个视角特征表示为

根据训练阶段得到的m个模型系数

根据训练阶段中得到的m个视角数据的贡献度权重θ

其中

根据式(7)中得到的测试样本t的融合预测值,以及设置的阈值

y

本实施例通过矩阵分解技术对原始标记空间进行降维,同时利用流形正则约束相似样本在低维潜在标记空间中具有相似的标记值;构建从每个视角数据到低维潜在标记空间的线性分类模型;在线性分类模型的基础上,根据各视角线性分类模型的预测损失,学习各视角对每个类别标记的贡献度,即“视角-标记”贡献度;根据“视角-标记”贡献度,计算任意两个视角在同一标记上的预测一致性,即“视角-标记”一致性权重,并据此约束不同视角分类模型在对应类别标记的预测结果一致性程度。本实施例首次提出从“视角-标记”角度学习多视角多标记分类问题中各视角对不同标记的贡献度,以及各视角在同一标记上的分类一致性,构建“视角-标记”一致性分类模型。利用学习到的“视角-标记”贡献度,通过提出的两阶段融合策略,可以有效融合多源信息,提升多视角多标记数据分类模型的性能。同时,通过对原始标记空间降维,大大降低模型的空间和时间复杂度,可用于处理大规模多视角多标记数据。

以上示意性的对本发明及其实施方式进行了描述,该描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。所以,如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号