基于集成学习的多标记学习算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在传统机器学习算法中，一个样本仅对应单个类别标记。而现实世界中，一个对象往往同时具备多个语义信息。为了对这些多义性对象进行建模，多标记学习算法应运而生。在多标记学习范式下，每个对象以一个示例来描述其特征信息，并以一个与之对应的标记集合来描述其语义信息。集成学习作为一类重要的机器学习技术，可以有效提升学习算法的泛化性能。本文将集成学习技术用于求解多标记学习问题，主要做了如下两方面的工作:
　　一方面，现实世界的很多应用都可以轻易地获取大量数据，而获取这些数据的真实标记却极为费时且昂贵，该问题在多标记学习中显得尤为突出。因此，通过对未标记数据的利用来提高学习系统的性能具有重要的研究价值。本文对传统的协同训练半监督学习方法进行扩展，提出了一种新的多标记半监督学习方法COINS(CO-training for INductive Semi-supervised multi-label learning)。相比于已有直推式多标记半监督学习方法，COINS可以实现归纳式学习建模且具有更好的泛化性能。
　　另一方面，多标记学习中各类别标记往往具有其独特的性质，为每个标记构造反映其特性的类属属性是求解多标记学习问题的一类重要技术。LIFT算法通过聚类的方式获取每个标记的类属属性以提高系统性能，但忽视了多标记学习中尤为重要的标记相关性。本文通过聚类集成的方式将标记相关性引入类属属性的生成过程，提出了基于聚类集成的类属属性多标记学习算法LIFTACE(multi-label learning with Label-specIfic FeaTures viA Clustering Emsemble)。相比于LIFT算法，LIFTACE算法可以有效利用聚类集成机制获得更好的泛化性能。
　　本文共分为五章。第一章主要介绍多标记学习的基本概念、研究现状，以及仍有待研究的问题;第二章给出多标记学习的问题定义，并针对有待研究的问题分析讨论了5种已有的多标记学习算法;第三章和第四章分别介绍两种基于集成学习的多标记学习算法，即基于协同训练的半监督多标记学习算法COINS以及基于聚类集成的类属属性多标记学习算法LIFTACE，并给出相应的实验结果;最后，第五章对全文做总结。

著录项

作者
詹望;
展开▼
作者单位

东南大学;

展开▼
授予单位东南大学;
学科计算机科学与技术；计算机应用技术
授予学位硕士
导师姓名张敏灵;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
多标记学习算法; 泛化性能; 类属属性; 集成学习;

相似文献

中文文献
外文文献
专利

1. 基于集成学习算法的带钢表面缺陷分类算法研究 [J] . 宗德祥 ,蒋渝 ,何永辉 . 宝钢技术 . 2021,第003期
2. 基于集成学习的不完备数据补全算法研究 [J] . 丁敬安 ,张欣海 ,胡博 . 中国电子科学研究院学报 . 2020,第001期
3. 基于集成学习的语音情感识别算法研究 [J] . 李田港 ,叶硕 ,叶光明 . 计算机技术与发展 . 2020,第006期
4. 基于集成学习的计算机辅助诊断青光眼算法研究 [J] . 柯士园 ,胡曼 ,徐永利 . 北京化工大学学报（自然科学版） . 2019,第004期
5. 基于集成学习约束能量最小化的高光谱目标检测算法研究 [J] . 张宁 ,赵睿 ,白郁 . 上海航天 . 2018,第001期
6. 基于训练集平行分割的集成学习算法研究 [C] . 文益民 ,王耀南 . 第二届全国智能信息处理学术会议 . 2009
7. 基于集成学习与多标记学习的蛋白质分类方法研究 [A] . 陈伟程 . 2014

基于集成学习的多标记学习算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅