首页> 外文期刊>電子情報通信学会技術研究報告. 思考と言語. Thought and Language >Locality-Sensitive Hashingを用いた階層的クラスタ解析手法の近似解法
【24h】

Locality-Sensitive Hashingを用いた階層的クラスタ解析手法の近似解法

机译:基于局部敏感哈希的层次聚类分析方法的近似解

获取原文
获取原文并翻译 | 示例
           

摘要

階層的クラスタ解析手法は類似度でデータを階層的に分類し、その結果は樹形図で表現することができる。 この手法を用いると細かい分類から大まかな分類までクラスタ間の包含関係が理解しやすいが、計算量は大きなものとなるので、高次元·大規模データに対して適用することは難しい。 本研究では階層的クラスタ解析の代表的なSingle-Link法に対して、高速な近似手法を提案する。 本手法は最近接点の候補を高速に見つけるアルゴリズムであるLocality-Sensitive Hashingにおいて作られるハッシュテーブルを用いることで計算量を減らす。 実験の結果、提案手法が(1)Single Link法と同じく楕円形以外のクラスタでも抽出できること、及び(2)高次元大規模データに対してSingle Link法より高速に動作することを確認した。
机译:层次聚类分析方法通过相似性对数据进行分层,结果可以用树状图表示。使用这种方法,很容易理解从细分类到粗分类的聚类之间的包含关系,但是由于计算量大,因此很难将其应用于高维和大规模数据。在这项研究中,我们为分层聚类分析的典型单链接方法提出了一种高速近似方法。此方法通过使用“局部敏感哈希”创建的哈希表来减少计算量,该算法是一种高速查找联系人候选对象的算法。实验结果证实,所提出的方法可以像单链接方法那样提取(1)椭圆形以外的簇,并且(2)对于高维大规模数据,其操作比单链接方法要快。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号