【24h】

Approximate Data Mining using Sketches for Massive Data

机译:近似数据挖掘使用草图进行大规模数据

获取原文

摘要

With the popularity of the Web and Internet, massive data is generated.However, this enormous datasets present the challenge to apply data mining techniques in order to extract useful information. Dimensionality reduction can be used to improve both efficiency and effectiveness while extracting information from data. In this paper we have proposed an algorithm to reduce the dimensionality of the datasets such that after applying data mining techniques on reduced datasets we get almost same results as with the original datasets. Random Sketch is used to reduce the dimensions of the dataset.
机译:随着Web和Internet的普及,生成了大规模数据。然而,这种巨大的数据集呈现了应用数据挖掘技术的挑战,以便提取有用的信息。 可以使用维数减少来提高从数据中提取信息的同时提高效率和有效性。 在本文中,我们提出了一种算法来降低数据集的维度,使得在将数据挖掘技术上应用于缩小的数据集之后,我们将与原始数据集一起获得几乎相同的结果。 随机草图用于减少数据集的尺寸。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号