基于分解策略的多标签在线分类算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

多标签分类中每一个样本可能同时与多个类别标签相关联，是传统的单标签分类中每个样本只能属于一个类别的扩展。近年来，多标签分类成为机器学习领域的一个研究的热点，出现了许多多标签分类算法。目前的多标签分类方法对训练样本的处理大多采用批量学习的方式，要求所有训练样本是可重复访问的，在具体算法实现中往往需要将整个训练数据集一次读入内存。对于较大规模的分类问题，批量学习的算法显得效率不够高或无法处理。在一些特殊的应用场景中，数据以序列的方式进入，批量学习算法也不能适用。与批量学习相对的，在线学习算法以可以很好地应对大规模数据的学习问题及顺序到达的流式数据。目前，已发表的采用在线学习方式的多标签分类算法还很少。
　　本文采用基于问题分解的策略，使用二类相关的问题分解方法，结合已有的一阶和二阶在线两类分类算法，提出了6种采用在线学习方式的多标签分类算法:MLCd-Perceptron, MLCd-ALMA, MLCd-OGD, MLCd-PA, MLCd-AROW,MLCd-SCW。在实验中，在5个较大规模的多标签基准数据集上，对6种在线多标签分类算法以及采用批量学习方式的ML-kNN算法在10个多标签分类性能评价指标及运行时间上进行比较。实验结果表明，平均来看，MLCd-OGD方法和MLCd-AROW算法相对于其他在线多标签算法有更好的性能。
　　对于多标签分类算法，分类阈值的选择是影响算法性能的一个重要方面，合适的阈值选择策略可以进一步提升分类算法的性能。本文对于多标签在线分类算法中的阈值选择方法进行研究，在最简单的阈值设置为常数的基础上，采用增量方式学习一个最小化汉明损失的线性回归模型的阈值选择策略。实验部分，在5个多标签基准数据集上，本文对应用两种不同阈值选择策略的多标签在线分类算法得到的实验结果进行了比较。实验结果表明采用线性回归模型的阈值选择策略对提高分类器性能有显著作用。

著录项

作者
张敏;
展开▼
作者单位

南京师范大学;

展开▼
授予单位南京师范大学;
学科计算机技术
授予学位硕士
导师姓名许建华;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;算法理论;
关键词
多标签分类; 在线学习; 二类相关分解; 阈值函数; 增量算法;

相似文献

中文文献
外文文献
专利

1. 基于特征加权张量分解的标签推荐算法研究 [J] . 孙玲芳 ,冯遵倡 . 江苏科技大学学报（自然科学版） . 2015,第006期
2. 采用分而治之策略的快速多标签支持向量机分类算法研究 [J] . 刘竞 ,郭忠文 ,孙中卫 . 中国海洋大学学报（自然科学版） . 2020,第012期
3. 基于加权Bayes分类器的流数据在线分类算法研究 [J] . 卢惠林 . 计算机科学 . 2014,第005期
4. 基于卷积神经网络的多标签图像分类识别算法研究 [J] . 张晓瑞 . 通化师范学院学报 . 2022,第2期
5. 基于隐空间映射的联合嵌入式多标签分类算法研究 [J] . 黄素叶 . 韶关学院学报 . 2021,第006期
6. 一种基于贝叶斯模型的多标签分类算法研究 [C] . Zhang Luoyang ,张洛阳 ,Mao Jiali . 第32届中国数据库学术会议 . 2015
7. 基于非负矩阵分解的多标签分类算法研究 [A] . 杨烁陶 . 2017

基于分解策略的多标签在线分类算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅