基于稀缺标记样本的半监督学习研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

基于稀缺标记样本的半监督学习作为传统半监督学习的一个重要领域，主要研究当样本集中标记样本与未标记样本数量存在严重不平衡性时，如何获得优秀的鲁棒分类器的问题。区别于一般的半监督学习问题，稀缺标记样本环境中标记样本的数量特别有限，往往只占整个样本集总量的1％-5%，这种严重不平衡的数据结构使得传统半监督学习方法难于构造具备优秀泛化能力的分类器。目前解决稀缺标记样本学习问题的方法一般采取传统的以标记样本为导向的学习策略。之前的研究成果表明，由于标记样本特别稀疏，这种思路在稀缺标记样本环境中并不可行。因此，为了进一步研究稀缺标记样本学习问题的特点并寻找更有效、更鲁棒的学习算法，本文从以下三个方面对基于稀缺标记样本的半监督学习提出了新的考量：
　　稀缺标记样本学习问题的定义与度量。文章首先对稀缺标记样本学习问题提出了严格的数学描述。在此基础上，采取稀缺标记样本区域内曲线下面积(AUCLR)来度量学习算法的性能并给出其数学表达。
　　采用以未标记样本为导向的方法。文章把稀缺标记样本半监督学习问题转化为一类特殊的无监督学习问题来处理。为了解决标记样本特别稀疏的难点，文章提出基于近似判断的约束扩展算法和基于矩阵幂积的约束传播算法。在此基础上，文章进一步提出采用基于约束传播的谱聚类算法CopSC来构造基分类器。最后，文章运用约束集的两类不一致性理论对算法表现进行了理论推导和优化。实验验证了CopSC在稀缺标记样本环境中良好的算法表现。
　　采用多重半监督假设。在处理稀缺标记样本学习问题时，基于单一半监督假设的算法鲁棒性表现较差。因此，文章提出同时利用全部三类半监督假设，并采用混合系数来控制其中单一假设的权值。实验表明文章提出的SS-CE3A算法在稀缺标记样本环境中具备优秀的泛化能力和鲁棒表现。

著录项

作者
陈立嵩;
展开▼
作者单位

中国科学技术大学;

展开▼
授予单位中国科学技术大学;
学科计算机应用技术
授予学位硕士
导师姓名唐珂;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
稀缺标记样本; 半监督学习; 约束扩展; 约束传播; 多重半监督假设;

相似文献

中文文献
外文文献
专利

1. 未标记样本在半监督学习中的应用方法研究 [J] . 曹慧 ,刘玉峰 . 广西轻工业 . 2008,第012期
2. 基于多标记与半监督学习的入侵检测方法研究 [J] . 钱燕燕 ,李永忠 ,余西亚 . 计算机科学 . 2015,第002期
3. 一种基于伪标签半监督学习的小样本调制识别算法 [J] . 史蕴豪 ,许华 ,刘英辉 . 西北工业大学学报 . 2020,第005期
4. 基于半监督学习的遥感影像分类训练样本时空拓展方法 [J] . 任广波 ,张杰 ,马毅 . 国土资源遥感 . 2013,第002期
5. 一种基于自组织过程神经网络的动态样本半监督学习算法 [J] . 王丹丹 ,刘显德 . 智能计算机与应用 . 2011,第003期
6. 一种基于样本有效性和KNN分类标记的采样传播型抠图方法 [C] . Chen Xiao ,陈晓 ,He Fazhi . 第九届全国几何设计与计算学术会议（GDC2016） . 2016
7. 基于最大间隔和半监督学习的偏标记学习算法研究 [A] . 张仕将 . 2019

基于稀缺标记样本的半监督学习研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅