首页> 中文学位 >基于双层结构和优序选择的多标签分类研究
【6h】

基于双层结构和优序选择的多标签分类研究

代理获取

目录

声明

摘要

1 绪论

1.1 研究背景

1.2 研究现状及问题

1.3 研究意义

1.4 本文的研究内容及结构安排

1.4.1 本文主要研究内容

1.4.2 本文的组织结构安排

2 知识背景与相关技术

2.1 多标签分类

2.1.1 多标签相关符号定义

2.1.2 问题转换类型多标签分类

2.3 支持向量机

2.3.1 SVM算法

2.3.2 SMO算法

2.4 互信息

2.5 图的相关知识与应用

2.5.1 最小生成树

2.5.2 Kruskal算法

2.5.3 层次遍历算法

2.6 本章小结

3 基于双层结构的多标签分类模型

3.1 问题描述

3.2 DLMC分类模型

3.2.1 DLMC模型整体设计

3.2.2 二元关联分类模型设计

3.2.3 带更新过程的链式分类模型设计

3.3 对比试验与分析

3.3.1 实验环境

3.3.2 实验数据集

3.3.3 实验评价指标

3.3.4 实验设置

3.3.5 实验测试与分析

3.5 本章小结

4 基于最大权重的有向标签树寻优序算法

4.1 问题描述

4.2 MWTOS算法

4.1.1 MWTOS思想概述

4.2.2 MWTOS详细设计

4.2.3 MWTOS算法描述

4.3 对比实验与分析

4.3.1 实验设置

4.3.2 实验测试与分析

4.4 本章小节

5 基于双层结构的多标签优序选择分类模型

5.1 问题描述

5.2 DLMOS模型

5.2.1 DLMOS整体设计

5.2.2 DLMOS算法描述

5.3 对比实验与分析

5.3.1 模拟数据集

5.3.2 实验设置

5.3.3 实验测试与分析

6 总结与展望

6.1 工作总结

6.2 工作展望

参考文献

致谢

研究生期间的科研成果

展开▼

摘要

分类是数据挖掘技术中的一个热门研究分支,它主要是利用样本数据集来构建一个分类模型,并使用该分类模型对未知样本实例进行类别信息的预测。在传统的单标签分类中,一个样本实例仅隶属于一个类别。然而,真实世界中却存在大量的多义性实例,即一个样本实例可能同时隶属于不同的类别,相应的分类问题被称作为多标签分类问题。最初,多标签学习起源于分档归类中遇到的多义性问题。经过数十年来的发展,多标签学习技术已在医疗诊断、生物遗传学、推荐系统、信息检索、图像视频等领域得到了广泛应用。
  随着多标签学习热度的持续上升,解决多标签分类问题的算法层出不穷,很多算法(如BR、CC、MBR)在设计过程往往存在忽略标签间的关联性、随机选择标签序列、冗余交互标签信息及交互过程中信息缺失等因素而导致算法的分类精度降低的问题,特别在将多标签分类转化为一个或者多个二元分类来解决分类问题上最为显著。针对上述存在的诸多问题,本文首先提出了基于双层结构的链式多标签分类(DLMC)算法,该算法构建了一个双层结构的分类模型,旨在通过层间交互和层内交互来实现标签间的关联性。第一层采用典型的二元关联分类模型实现对实例的第一次分类,并与第二层进行标签信息的交互;第二层构建带有更新过程的链式分类模型,用链来传递和更新标签信息,实现分类信息的二次交互。其次,提出构建具有最大权重的标签生成树(MWTOS)算法,寻求标签优序,以解决链式分类模型因随机选择类标号序列对二值分类器进行训练而导致分类精度降低的问题。然后,提出基于双层结构的多标签优序选择分类(DLMOS)算法,该算法是一个汇集了三个框架模型:二元关联分类模型,链式分类模型,嵌套堆叠模型于一体,并携优化处理过程的分类模型。该模型在兼并DLMC和MWTOS优点的同时还解决了信息交冗余及缺失的问题。最后,构建了具有较强关联性的模拟数据集,使用已知的关联性数据去验证DLMOS算法处理标签关联性的能力。最后通过在基准数据集和模拟数据集上与相关算法作比较,验证算法的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号