...
首页> 外文期刊>電子情報通信学会技術研究報告 >競合学習を用いた情報理論的クラスタリング: 文書クラスタリングにおける基準及びアルゴリズムの比較
【24h】

競合学習を用いた情報理論的クラスタリング: 文書クラスタリングにおける基準及びアルゴリズムの比較

机译:基于竞争学习的信息理论聚类:文档聚类中标准和算法的比较

获取原文
获取原文并翻译 | 示例
           

摘要

Information-theoretic clustering (ITC) finds clusters based on the similarity of the distributions of features. An ITC algorithm based on optimizing the clustering criterion has previously been proposed. This algorithm is reminiscent of the k-means algorithm, but uses Kullback-Leibler (KL) divergence when updating the cluster-labels of the data. Recently, a novel method, based on the idea above, has been proposed. It uses competitive learning, which is known to be superior to the k-means algorithm. The method also uses skew divergence instead of KL divergence to avoid the zero-frequency problem. This paper shows that the method performs better than existing clustering algorithms, such as maximum margin clustering and a method based on mixture of von Mises-Fisher distribution, when applied to text data sets in multiclass problems.%情報理論的クラスタリング(ITC:information-theoretic clustering)は,特徴分布の類似性によりクラスタをまとめる方法である.近年,クラスタリング基準が明確化され,この基準の最適化によるITCアルゴリズムが提案された.このアルゴリズムは,k-means法においてデータが属するクラスタラベルを更新する時に評価関数としてKL(Kullback Leibler)ダイバージェンスを用いる.最近,この考え方に基づいた,新しいアルゴリズムが提案された.その手法は,ゼロ頻度問題を回避するため,KLダイバージェンスの代わりにその近似であるskewダイバージェンスを用い,学習アルゴリズムとしては,k-means法に対する優位性が確認されている競合学習を用いる.本稿は,前記手法がテキストデータを対象とした多クラス問題において,最大マージンクラスタリングや混合von Mises-Fisher分布に基づく方法などの既存アルゴリズムに比べて優れていることを実験により示した.
机译:信息理论聚类(ITC)根据特征分布的相似性找到聚类。先前已经提出了一种基于优化聚类标准的ITC算法。该算法让人想起k均值算法,但是在更新数据的聚类标签时使用Kullback-Leibler(KL)散度。最近,基于上述思想,提出了一种新颖的方法。它使用竞争性学习,而竞争性学习优于k-means算法。该方法还使用偏斜发散而不是KL发散来避免零频问题。本文显示了该方法在应用于多类问题中的文本数据集时,其性能优于现有的聚类算法,例如最大余量聚类和基于von Mises-Fisher分布混合的方法。%情报理论的クラスタリング(ITC:information -理论集群)は,特徴分布の类似性によりクラスタをまとめる方法である。最近ータが属するクラスタラベルベ更新する时に评価关数としてKL(Kullback Leibler)ダイバージェンスを用いる。の代わりにその近似であるskewダイバージェンジェンスを用い,学习アルゴリズムとしては,k-means法に対する优位性が确认されている竞合学习を用いる。 ,最大混合von Mises-Fisher分布に基づく方法などの既存アルゴリズムに比べて优れていることを実験により示した。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号