...
首页> 外文期刊>電子情報通信学会技術研究報告 >競合学習を用いた情報理論的クラスタリング: クラスタリングにおける基準及びアルゴリズムの比較
【24h】

競合学習を用いた情報理論的クラスタリング: クラスタリングにおける基準及びアルゴリズムの比較

机译:基于竞争学习的信息理论聚类:聚类中标准和算法的比较

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

情報理論的クラスタリング(ITC:information-theoretic clustering)は,特徴分布の類似性によりクラスタをまとめる方法である.近年,クラスタリング基準が明確化され,この基準の最適化によるITCアルゴリズムが提案された.このアルゴリズムは,k-means法においてデータが属するクラスタラベルを更新する時に評価関数としてKL(Kullback Leibler)ダイバージエンスを用いる.最近,この考え方に基づいた,新しいアルゴリズムが提案された.その手法は,ゼロ頻度問題を回避するため,KLダイパージエンスの代わりにその近似であるskewダイバージエンスを用い,学習アルゴリズムとしては,k-means法に対する優位性が確認されている競合学習を用いる.本稿は,前記手法がテキストデータを対象とした多クラス問題において,最大マージンクラスタリングゃ混合von Mises-Fisher分布に基づく方法などの既存アルゴリズムに比べて優れていることを実験により示した.%Information-theoretic clustering (ITC) finds clusters based on the similarity of the distributions of features. An ITC algorithm based on optimizing the clustering criterion has previously been proposed. This algorithm is reminiscent of the k-means algorithm, but uses Kullback-Leibler (KL) divergence when updating the cluster-labels of the data. Recently, a novel method, based on the idea above, has been proposed. It uses competitive learning, which is known to be superior to the k-means algorithm. The method also uses skew divergence instead of KL divergence to avoid the zero-frequency problem. This paper shows that the method performs better than existing clustering algorithms, such as maximum margin clustering and a method based on mixture of von Mises-Fisher distribution, when applied to text data sets in multiclass problems.
机译:信息理论聚类(ITC)是一种基于特征分布的相似性对聚类进行分组的方法,近年来,对聚类的判据进行了澄清,并通过对该准则进行优化来提出了ITC算法。该算法在k-means方法中更新数据所属的聚类标签时,以KL(Kullback Leibler)散度为评估函数,最近提出了一种基于该思想的新算法。为了避免零频率问题,使用倾斜散度(它是KL浸入清除的近似值)代替KL浸入清除,并且已被证明优于k均值方法的竞争性学习被用作学习算法。实验表明,在文本数据多类问题中,上述方法优于现有的最大边距聚类算法和基于混合von Mises-Fisher分布的算法。%信息理论聚类(ITC)根据特征分布的相似性来查找聚类。以前曾提出过一种基于优化聚类准则的ITC算法,该算法让人想起k-means算法,但在使用Kullback-Leibler(KL)散度时更新数据的聚类标签最近,基于上述思想,提出了一种新方法,该方法利用竞争性学习方法,该方法优于k-means算法。吉隆坡本文证明了该方法在应用于多类问题的文本数据集时,其性能优于现有的聚类算法,例如最大余量聚类和基于von Mises-Fisher分布的混合方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号