密度峰值隶属度优化的半监督Self-Training算法

刘学文; 王继奎; 杨正国; 李冰; 聂飞平

首页> 中文期刊> 《计算机科学与探索》 >密度峰值隶属度优化的半监督Self-Training算法

密度峰值隶属度优化的半监督Self-Training算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

现实中由于获取标签的成本很高,大部分的数据只含有少量标签。相比监督学习和无监督学习,半监督学习能充分利用数据集中的大量无标签数据和少量有标签数据,以较少的标签成本获得较高的学习性能。自训练算法是一种经典的半监督学习算法,在其迭代优化分类器的过程中,不断从无标签样本中选取高置信度样本并由基分类器赋予标签,再将这些样本和伪标签添加进训练集。选取高置信度样本是Self-Training算法的关键,受密度峰值聚类算法(DPC)启发,将密度峰值用于高置信度样本的选取,提出了密度峰值隶属度优化的半监督Self-Training算法(STDPM)。首先,STDPM利用密度峰值发现样本的潜在空间结构信息并构造原型树。其次,搜索有标签样本在原型树上的无标签近亲结点,将无标签近亲结点的隶属于不同类簇的峰值定义为簇峰值,归一化后作为密度峰值隶属度。最后,将隶属度大于设定阈值的样本作为高置信度样本,由基分类器赋予标签后添加进训练集。STDPM充分利用密度峰值所隐含的密度和距离信息,提升了高置信度样本的选取质量,进而提升了分类性能。在8个基准数据集上进行对比实验,结果验证了STDPM算法的有效性。

著录项

来源
《计算机科学与探索》 |2022年第9期|2078-2088|共11页
作者
刘学文; 王继奎; 杨正国; 李冰; 聂飞平;
展开▼
作者单位

兰州财经大学信息工程学院;

西北工业大学光学影像分析与学习中心;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
密度峰值隶属度; 簇峰值; 原型树; 近亲结点集; 自训练;

相似文献

中文文献
外文文献
专利

1. 半监督约束集成的快速密度峰值聚类算法 [J] . 刘如辉 ,黄炜平 ,王凯 . 浙江大学学报（工学版） . 2018,第011期
2. 一种基于密度峰值的半监督聚类算法 [J] . 罗丹 ,毛先成 ,邓浩 . 地理与地理信息科学 . 2017,第2期
3. 基于双重密度和簇间近邻度的密度峰值聚类算法 [J] . 李沛武 ,张永芳 ,黄逸翠 . 南昌工程学院学报 . 2022,第4期
4. 结合鲸鱼优化算法的自适应密度峰值聚类算法 [J] . 王芙银 ,张德生 ,张晓 . 计算机工程与应用 . 2021,第3期
5. 近邻样本密度和隶属度加权FCM算法的遥感图像分类方法 [J] . 刘小芳 ,何彬彬 . 仪器仪表学报 . 2011,第10期
6. 基于密度峰值的三维模型无监督分类算法 [C] . Shu Zhenyu ,舒振宇 ,Qi Chengwu . 第九届全国几何设计与计算学术会议（GDC2016） . 2016
7. 半监督约束快速密度峰值聚类算法研究及其在空调控制上的应用 [A] . 刘如辉 . 2018

密度峰值隶属度优化的半监督Self-Training算法

摘要

著录项

相似文献

相关主题

期刊订阅