首页> 外文期刊>IEEE Transactions on Signal Processing >Clustering of Data With Missing Entries Using Non-Convex Fusion Penalties
【24h】

Clustering of Data With Missing Entries Using Non-Convex Fusion Penalties

机译:使用非凸融合惩罚对缺失项进行数据聚类

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

The presence of missing entries in data often creates challenges for pattern recognition algorithms. Traditional algorithms for clustering data assume that all the feature values are known for every data point. We propose a method to cluster data in the presence of missing information. Unlike conventional clustering techniques where every feature is known for each point, our algorithm can handle cases where a few feature values are unknown for every point. For this more challenging problem, we provide theoretical guarantees for clustering using a $l_0$ fusion penalty based optimization problem. Furthermore, we propose an algorithm to solve a relaxation of this problem using saturating non-convex fusion penalties. It is observed that this algorithm produces solutions that degrade gradually with an increase in the fraction of missing feature values. We demonstrate the utility of the proposed method using a simulated dataset, the Wine dataset and the ASL dataset. It is shown that the proposed method is a promising clustering technique for datasets with large fractions of missing entries.
机译:数据中缺少条目的存在通常给模式识别算法带来挑战。传统的数据聚类算法假设每个数据点的所有特征值都是已知的。我们提出了一种在缺少信息的情况下对数据进行聚类的方法。与传统的聚类技术不同,在传统的聚类技术中,每个点的每个特征都是已知的,我们的算法可以处理每个点都未知的几个特征值的情况。对于这个更具挑战性的问题,我们为使用基于$ l_0 $融合罚分的优化问题进行聚类提供了理论保证。此外,我们提出了一种使用饱和非凸融合惩罚来解决该问题的算法。可以观察到,该算法产生的解决方案随着缺失的特征值的分数的增加而逐渐降低。我们使用模拟数据集,Wine数据集和ASL数据集演示了该方法的实用性。结果表明,所提出的方法是一种很有前途的聚类技术,适用于丢失条目大部分的数据集。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号