Semi-supervised clustering algorithm based on small size of labeled data

机译：基于标记数据量小的半监督聚类算法

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

In many data mining domains,labeled data is very expensive to generate,how to make the best use of labeled data to guide the process of unlabeled clustering is the core problem of semi-supervised clustering.Most of semi-supervised clustering algorithms require a certain amount of labeled data and need set the values of some parameters,different values maybe have different results.In view of this,a new algorithm,called semi-supervised clustering algorithm based on small size of labeled data,is presented,which can use the small size of labeled data to expand labeled dataset by labeling their k-nearest neighbors and only one parameter.We demonstrate our clustering algorithm with three UCI datasets,compared with SSDBSCAN[4] and KNN,the experimental results confirm that accuracy of our clustering algorithm is close to that of KNN classification algorithm.

机译：在许多数据挖掘领域中，标记数据的生成非常昂贵，如何充分利用标记数据来指导非标记聚类的过程是半监督聚类的核心问题。大多数半监督聚类算法都需要一定的条件。针对这种情况，提出了一种新的算法，即基于小数据量的半监督聚类算法。小尺寸的标记数据通过标记k个近邻和仅一个参数来扩展标记数据集。我们用3个UCI数据集演示了聚类算法，与SSDBSCAN [4]和KNN相比，实验结果证实了该聚类算法的准确性接近于KNN分类算法。

著录项

来源
《International conference on frontiers of manufacturing and design science》|2012年|4675-4679|共5页
会议地点
作者
Mingwei Leng; Xiaoyun Chen; Jianjun Cheng; Longjie Li;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类机械制造工艺;
关键词
Data Mining; semi-supervised clustering; label propagation;

机译：数据挖掘;半监督聚类;标签传播;
入库时间 2022-08-26 15:10:12

相似文献

外文文献
中文文献
专利

1. SELP: Semi-supervised evidential label propagation algorithm for graph data clustering [J] . Zhou Kuang, Martin Arnaud, Pan Quan, 高分子論文集 . 2018,第jana期

机译：SELP：用于图数据聚类的半监督证据标签传播算法
2. Clustering analysis of gene expression data based on semi-supervised visual clustering algorithm [J] . Chung FL, Wang ST, Deng ZH, Soft computing: A fusion of foundations, methodologies and applications . 2006,第11期

机译：基于半监督视觉聚类算法的基因表达数据聚类分析
3. Summarizing Relational Data Using Semi-Supervised Genetic Algorithm-Based Clustering Techniques [J] . Rayner Alfred Journal of computer sciences . 2010,第7期

机译：使用基于半监督遗传算法的聚类技术汇总关系数据
4. Semi-Supervised Clustering Algorithm Based on Small Size of Labeled Data [C] . Mingwei Leng, Xiaoyun Chen, Jianjun Cheng, International Conference on Frontiers of Manufacturing and Design Science . 2012

机译：基于尺寸标记数据的半监督聚类算法
5. Data mining based learning algorithms for semi-supervised object identification and tracking. [D] . Dessauer, Michael P. 2011

机译：基于数据挖掘的学习算法，用于半监督对象识别和跟踪。
6. A Euclidean Group Assessment on Semi-Supervised Clustering for Healthcare Clinical Implications Based on Real-Life Data [O] . Muhammad Noman Sohail, Jiadong Ren, Musa Uba Muhammad 2019

机译：基于现实生活数据的半监督聚类对医疗保健临床意义的欧氏群体评估
7. SELP: Semi-supervised evidential label propagation algorithm for graph data clustering [O] . Zhou, Kuang, Martin, Arnaud, Pan, Quan, 2018

机译：SELP：用于图数据聚类的半监督证据标签传播算法

Semi-supervised clustering algorithm based on small size of labeled data

摘要

著录项

相似文献

相关主题

期刊订阅