基于多任务学习的数据分类方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在大数据应用环境下，信息产生的渠道不断增多，信息表达的方式也越来越多，数据的分析和挖掘面临很大的挑战。在机器学习领域，处理数据分类问题时，需要对进行分类的不同数据集建立对应的分类模型，即常规的单任务学习。但由于单任务学习存在信息利用不充分的局限性，导致分类正确率较低，因此挖掘多个训练任务之间的关联，对这些任务进行联合学习，从而提高模型泛化能力的多任务学习成为当前研究的热点课题之一。然而，现有分类方法在提取多个任务相关性方面仍有很大不足，忽略了对于含孤立任务的多个任务之间的关联性提取，以及与其他的分类技术进行有效结合，从而使分类正确率遇到瓶颈。本文通过利用机器学习领域的相关技术和方法，遵循提高数据分类正确率这一目标，针对目前基于多任务学习的数据分类技术存在的问题和不足展开研究，取得了一定的创新成果。论文主要研究工作有如下几点:
　　(1)针对现有多任务学习模型对任务间的关联提取层次较为单一和提取不充分问题，提出了一种实现稀疏诱导的多任务学习模型。在传统研究的基础上，本文通过利用可以实现稀疏诱导的组稀疏范数来获得针对特定任务的组稀疏，实现多个相关任务间的特征共享，并提取任务内各个类别之间的关联，同时结合不同特征组合之间的预测一致性原理，构造了在两个层次上全面提取任务间相关性的多任务学习模型。
　　(2)针对本文提出的MTMVC+分类模型，由于目标函数中存在非平滑正则项，为非凸函数，因此不能够使用传统的针对凸规划问题的求解算法。为此，本文提出并实现了一种交替迭代优化算法，通过对模型中的变量分别固定和求解，并不断交替迭代直至目标函数收敛，从而实现目标模型求解，此外进一步证明了该算法的收敛性。最后，通过在20Newsgroup数据集上进行实验，展示了算法的有效性。
　　(3)本文通过在WebKB、NUS-WIDE Object和Multi-feature digit三个多媒体基准数据集上进行实验，将本文提出的进行稀疏诱导的MTMVC+模型与当下多任务学习领域经典的模型进行对比，实验结果验证了本文提出的MTMVC+改进模型通过全面提取多个任务间关联，能够有效地提高数据分类正确率，并且计算出提升幅度在7％～9％。

著录项

作者
马建阳;
展开▼
作者单位

北京交通大学;

展开▼
授予单位北京交通大学;
学科计算机科学与技术
授予学位硕士
导师姓名张宝鹏;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
数据分类; 关联性提取; 多任务学习; 正确率;

相似文献

中文文献
外文文献
专利

1. 基于多任务学习的多源数据分类研究 [J] . 马建阳 ,张宝鹏 . 计算机应用研究 . 2018,第011期
2. 基于Mapreduce与关联分类挖掘的海量数据分类增量挖掘方法研究 [J] . 何波 . 福建电脑 . 2017,第004期
3. 基于《数据安全法》的数据分类分级方法研究 [J] . 高磊 ,赵章界 ,林野丽 . 信息安全研究 . 2021,第010期
4. 基于《数据安全法》的数据分类分级方法研究 [J] . 高磊 ,赵章界 ,林野丽 . 信息安全研究 . 2021,第010期
5. 基于数据降维的复杂属性大数据分类方法研究 [J] . 胡淑新 ,宋志蕙 . 河南科技 . 2020,第002期
6. 基于深度多任务学习的层次分类 [C] . Zhao Qilu ,赵其鲁 ,Li Zongmin . 2017中国计算机辅助设计与图形学大会（2017 China CADCG） . 2017
7. 基于流形学习和多任务学习的肿瘤基因表达数据分类方法研究 [A] . 田贝贝 . 2015

基于多任务学习的数据分类方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅