首页> 外文期刊>電子情報通信学会技術研究報告 >正規化最尤符号化に基づくグラフクラスタリング
【24h】

正規化最尤符号化に基づくグラフクラスタリング

机译:基于归一化最大似然编码的图聚类

获取原文
获取原文并翻译 | 示例
       

摘要

本論文では記述長最小化原理に基づく新たなグラフクラスタリングの手法を提案する.グラフクラスタリングとは,グラフが与えられたとき,そのノードを類似する特徴を持つノード同士が同じクラスター(グループ)に入るように分割する問題である.ここでは,グラフの確率構造にナイーブベイズモデルを導入し,グラフを符号化したときの記述長を最小化するという基準のもとでクラスター数を最適化することを考える.具体的にはデータの記述長を最小化することで知られている正規化最尤符号化を用いる.また,既存のAICやBICといった基準と収束速度を比較することによって本手法の有効性を検証することとする.%This paper addresses the issue of graph clustering, i.e., assigning nodes for a given graph into a number of clusters, in each of which similar nodes are grouped together. We propose a novel method of graph clustering from the view of the minimum description length principle. In it we employ a Naive Bayes model for the representation of a probabilistic structure of a graph and select the number of optimal clusters so that the total codelength required for encoding the graph is minimum. Specifically we employ the normalized maximum likelihood coding technique in the codelength computation, which achieves the shortest codelength over possible coding ones and is implemented efficiently. We empirically demonstrate the effectiveness of the proposed method in terms of the rate of convergence of the selected number of clusters in comparison with AIC and BIC.
机译:本文基于描述长度最小化原理提出了一种新的图聚类方法。图聚类是一个问题,给定一个图,它会划分节点,以使具有相似特征的节点位于同一聚类(组)中。在这里,我们考虑将朴素贝叶斯模型引入图的随机结构中,并基于最小化图编码时描述长度的准则来优化聚类数。具体地,使用已知的最小化数据的描述长度的归一化最大似然编码。此外,通过将收敛速度与AIC和BIC等现有标准进行比较,可以验证该方法的有效性。本文解决了图聚类的问题,即将给定图的节点分配到多个聚类中,每个聚类中的相似节点被分组在一起。我们从最小描述长度的角度提出了一种新的图聚类方法其中我们采用朴素贝叶斯模型表示图的概率结构,并选择最佳聚类的数量,以使对图进行编码所需的总码长最小。我们从经验上证明了该方法的有效性,与AIC和BIC相比,所选聚类数的收敛速度更高。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号