首页> 外文期刊>JMLR: Workshop and Conference Proceedings >Classification from Pairwise Similarity and Unlabeled Data
【24h】

Classification from Pairwise Similarity and Unlabeled Data

机译:从成对相似性和未标记数据分类

获取原文
           

摘要

Supervised learning needs a huge amount of labeled data, which can be a big bottleneck under the situation where there is a privacy concern or labeling cost is high. To overcome this problem, we propose a new weakly-supervised learning setting where only similar (S) data pairs (two examples belong to the same class) and unlabeled (U) data points are needed instead of fully labeled data, which is called SU classification. We show that an unbiased estimator of the classification risk can be obtained only from SU data, and the estimation error of its empirical risk minimizer achieves the optimal parametric convergence rate. Finally, we demonstrate the effectiveness of the proposed method through experiments.
机译:监督学习需要大量标记数据,这可能是一个隐私问题或标签成本的情况下的大瓶颈。为了克服这个问题,我们提出了一个新的弱监督学习设置,其中只需要类似(S)数据对(两个示例属于同一类)和未标记的(U)数据点而不是完全标记的数据,称为SU分类。我们表明,只能从SU数据获得分类风险的无偏估计,并且其经验风险最小化器的估计误差实现了最佳的参数收敛速率。最后,我们通过实验证明了所提出的方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号