首页> 外文会议>SYNAT Workshop >Data Model for Analysis of Scholarly Documents in the MapReduce Paradigm
【24h】

Data Model for Analysis of Scholarly Documents in the MapReduce Paradigm

机译:MapReduce Paradigm中学术文档分析的数据模型

获取原文

摘要

At CeON ICM UW we are in possession of a large collec tion of scholarly documents that we store and process using MapReduce paradigm. One of the main challenges is to design a simple, but effective data model that fits various data access patterns and allows us to perform diverse analysis efficiently. In this paper, we will describe the organiza tion of our data and explain how this data is accessed and processed by open-source tools from Apache Hadoop Ecosystem.
机译:在Ceon ICM UW,我们拥有我们使用MapReduce Paradigm存储和流程的学术文档的大型聚会。主要挑战之一是设计一种简单但有效的数据模型,该模型适合各种数据访问模式,并允许我们有效地执行各种分析。在本文中,我们将描述我们的数据组织,并解释如何通过Apache Hadoop生态系统的开源工具访问和处理该数据。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号