【24h】

A distributed Arabic text classification approach using latent semantic analysis for big data

机译:基于潜在语义分析的大数据分布式阿拉伯文本分类方法

获取原文

摘要

Recently, big data have special concerns from researchers, this due to the valuable information can be collected from it. LSA has an effective performance in classification, and information retrieval, since it deals with the semantics of the words. In this paper, we proposed a distributed text classification approach based on LSA, and Cosine Similarity, and can be applied to big data. The proposed approach reduced the time required for classification, and outperform the related work in terms of precision, and recall.
机译:最近,大数据引起了研究人员的特别关注,这是因为可以从中收集有价值的信息。由于LSA处理单词的语义,因此它在分类和信息检索方面具有有效的性能。本文提出了一种基于LSA和余弦相似度的分布式文本分类方法,可以应用于大数据。所提出的方法减少了分类所需的时间,并且在准确性和召回率方面优于相关工作。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号