首页> 外文会议>Advances in information retrieval theory >Avoiding Bias in Text Clustering Using Constrained K-means and May-Not-Links
【24h】

Avoiding Bias in Text Clustering Using Constrained K-means and May-Not-Links

机译:使用约束K均值和May-Not-Links避免文本聚类中的偏差

获取原文
获取原文并翻译 | 示例

摘要

In this paper we present a new clustering algorithm which extends the traditional batch k-means enabling the introduction of domain knowledge in the form of Must, Cannot, May and May-Not rules between the data points. Besides, we have applied the presented method to the task of avoiding bias in clustering. Evaluation carried out in standard collections showed considerable improvements in effectiveness against previous constrained and non-constrained algorithms for the given task.
机译:在本文中,我们提出了一种新的聚类算法,该算法扩展了传统的批处理k均值,从而可以在数据点之间以Must,Cannot,May和May-Not规则的形式引入领域知识。此外,我们将提出的方法应用于避免聚类偏差的任务。在标准集合中进行的评估显示,针对给定任务,与以前的约束和非约束算法相比,有效性有显着提高。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号