首页> 外文期刊>Ekonomska Istrazivanja >Processing unstructured documents and social media using Big Data techniques
【24h】

Processing unstructured documents and social media using Big Data techniques

机译:使用大数据技术处理非结构化文档和社交媒体

获取原文
           

摘要

Big Data technologies can be very useful when it comes to storing and processing using sophisticated algorithms, terabytes or petabytes of data. With the latest advancements, such as Hadoop YARN, processing can be done not only in batch but also in real time. In this paper, we detail a methodology followed by a case study that investigates the power of machine learning algorithms used in a Hadoop environment in classifying unstructured data. We also investigate how to capture geolocated messages from social networks and how kriging can be used to see if there is a strong relationship between two or more such datasets.
机译:大数据技术在使用复杂算法(TB或PB级数据)进行存储和处理时非常有用。利用Hadoop YARN等最新技术,不仅可以批量处理,而且可以实时处理。在本文中,我们将详细介绍一种方法,然后进行案例研究,以研究Hadoop环境中使用的机器学习算法对非结构化数据进行分类的功能。我们还研究了如何从社交网络中捕获地理位置信息,以及如何使用克里金法查看两个或多个此类数据集之间是否存在很强的关系。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号