首页> 外文会议>International conference on similarity search and applications >Applying Compression to Hierarchical Clustering
【24h】

Applying Compression to Hierarchical Clustering

机译:应用压缩到分层群集

获取原文

摘要

Hierarchical Clustering is widely used in Machine Learning and Data Mining. It stores bit-vectors in the nodes of a k-ary tree, usually without trying to compress them. We suggest a data compression application of hierarchical clustering with a double usage of the xoring operations defining the Hamming distance used in the clustering process, extending it also to be used to transform the vector in one node into a more compressible form, as a function of the vector in the parent node. Compression is then achieved by run-length encoding, followed by optional Huffman coding, and we show how the compressed file may be processed directly, without decompression.
机译:分层聚类广泛用于机器学习和数据挖掘。它在K-ary树的节点中存储位向载体,通常而不尝试压缩它们。我们建议使用定义群集过程中使用的汉明距离的XORING距离的双重使用的分层群集数据压缩应用程序,扩展它也用于将一个节点中的向量转换为更可压缩的形式,以便父节点中的向量。然后通过运行长度编码实现压缩,然后是可选的霍夫曼编码,并且我们展示了如何直接处理压缩文件,而不会减压。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号