首页> 中文学位 >基于集成学习的多标记学习算法研究
【6h】

基于集成学习的多标记学习算法研究

代理获取

目录

声明

摘要

插图目录

表格目录

术语与符号约定

第一章 绪论

1.2 研究现状

1.3 有待研究的问题

1.3.1 未标记数据的利用

1.3.2 类属属性

1.4 本文组织

第二章 多标记学习算法

2.1.1 学习框架

2.1.2 评价指标

2.1.3 学习算法

2.2 半监督多标记学习算法

2.2.1 SMSE

2.2.2 TRAM

2.2.3 iMLCU

2.3 类属属性多标记学习算法

2.3.1 LIFT

2.3.2 LLSF

第三章 基于协同训练的半监督多标记学习算法

3.1 协同训练

3.2 COINS算法

3.2.1 构建分类器

3.2.2 监督信息交互

3.3 实验结果

3.3.1 实验设置

3.3.2 结果分析

3.4 小结

第四章 基于聚类集成的类属属性多标记学习算法

4.1 聚类算法

4.2 LIFTACE算法

4.2.1 构建类属属性

4.2.2 训练分类器

4.3 实验结果

4.3.1 实验设置

4.3.2 结果分析

4.4 小结

第五章 结束语

致谢

参考文献

作者简介

展开▼

摘要

在传统机器学习算法中,一个样本仅对应单个类别标记。而现实世界中,一个对象往往同时具备多个语义信息。为了对这些多义性对象进行建模,多标记学习算法应运而生。在多标记学习范式下,每个对象以一个示例来描述其特征信息,并以一个与之对应的标记集合来描述其语义信息。集成学习作为一类重要的机器学习技术,可以有效提升学习算法的泛化性能。本文将集成学习技术用于求解多标记学习问题,主要做了如下两方面的工作:
  一方面,现实世界的很多应用都可以轻易地获取大量数据,而获取这些数据的真实标记却极为费时且昂贵,该问题在多标记学习中显得尤为突出。因此,通过对未标记数据的利用来提高学习系统的性能具有重要的研究价值。本文对传统的协同训练半监督学习方法进行扩展,提出了一种新的多标记半监督学习方法COINS(CO-training for INductive Semi-supervised multi-label learning)。相比于已有直推式多标记半监督学习方法,COINS可以实现归纳式学习建模且具有更好的泛化性能。
  另一方面,多标记学习中各类别标记往往具有其独特的性质,为每个标记构造反映其特性的类属属性是求解多标记学习问题的一类重要技术。LIFT算法通过聚类的方式获取每个标记的类属属性以提高系统性能,但忽视了多标记学习中尤为重要的标记相关性。本文通过聚类集成的方式将标记相关性引入类属属性的生成过程,提出了基于聚类集成的类属属性多标记学习算法LIFTACE(multi-label learning with Label-specIfic FeaTures viA Clustering Emsemble)。相比于LIFT算法,LIFTACE算法可以有效利用聚类集成机制获得更好的泛化性能。
  本文共分为五章。第一章主要介绍多标记学习的基本概念、研究现状,以及仍有待研究的问题;第二章给出多标记学习的问题定义,并针对有待研究的问题分析讨论了5种已有的多标记学习算法;第三章和第四章分别介绍两种基于集成学习的多标记学习算法,即基于协同训练的半监督多标记学习算法COINS以及基于聚类集成的类属属性多标记学习算法LIFTACE,并给出相应的实验结果;最后,第五章对全文做总结。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号