...
首页> 外文期刊>電子情報通信学会論文誌 >競合学習を用いた情報理論的クラスタリング
【24h】

競合学習を用いた情報理論的クラスタリング

机译:基于竞争学习的信息理论聚类

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

情報理論的クラスタ1)ング(ITC:inbrmation-theoretic clustering)は,特徴分布の類似性によりクラスタをまとめる方法である.近年,クラスタリング基準が明確化され,この基準の最適化によるITCアルゴリズムが提案された.このアルゴリズムは,k-means法においてデータが属するクラスタラベルを更新するときに評価関数としてKL(Kullback Leibler)ダイバージュンスを用いる.本論文では,この考え方に基づき,新しいアルゴリズムを提案する.提案手法は,ゼロ頻度問題を回避するため,KLダイバージエンスの代わりにその近似であるskewダイバージュンスを用い,学習アルゴリズムとしては,k-means法に対する優位性が確認されている競合学習を用いる.いくつかの実験により,提案手法はテキストデータを対象とした多クラス問題において最大マージンクラスタリングなどの既存アルゴリズムに比べて優れていることを示した.
机译:信息理论聚类(ITC)是一种基于特征分布的相似性对聚类进行分组的方法。近年来,已经弄清了聚类标准,并且通过优化该标准提出了ITC算法。当以k-means方法更新数据所属的簇标签时,该算法将KL(Kullback Leibler)散度用作评估函数。在本文中,我们基于此思想提出了一种新算法。为了避免零频率问题,提出的方法使用作为KL发散的近似值的偏斜发散而不是KL发散,并使用竞争性学习作为学习算法,该竞争性学习已被证明比k均值方法优越。 。实验表明,该方法优于现有算法,如文本数据多类问题中的最大余量聚类。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号