...
首页> 外文期刊>Journal of supercomputing >Hash-tree PCA: accelerating PCA with hash-based grouping
【24h】

Hash-tree PCA: accelerating PCA with hash-based grouping

机译:哈希树PCA:加速基于哈希分组的PCA

获取原文
获取原文并翻译 | 示例
           

摘要

In data mining or machine learning, one of the most commonly used feature extraction techniques is principal component analysis (PCA). However, it performs poorly on a large dataset. In this paper, we propose a new method of accelerating conventional PCA, named hash-tree PCA. It samples the objects that are similar to each other without losing the original data distribution. First, it explores similar objects and stores them in hash tables. Afterward, it samples a certain number of the objects from each hash table and creates a new dataset with a reduced number of objects. Finally, it executes PCA on the sampled dataset. Experimental results show that our method outperforms the PCA and fast PCA methods.
机译:在数据挖掘或机器学习中,最常用的特征提取技术之一是主要成分分析(PCA)。但是,它在大型数据集上表现不佳。在本文中,我们提出了一种加速传统PCA的新方法,名为Hash-Tree PCA。它对对象采样相似的对象而不会丢失原始数据分布。首先,它探讨了类似的对象并将它们存储在哈希表中。之后,它采样来自每个哈希表的一定数量的对象,并创建具有减少数量的对象的新数据集。最后,它在采样的数据集上执行PCA。实验结果表明,我们的方法优于PCA和快速PCA方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号