首页> 外文学位 >Using MapReduce for scalable and distributed processing of scientific XML data.
【24h】

Using MapReduce for scalable and distributed processing of scientific XML data.

机译:使用MapReduce进行科学XML数据的可扩展和分布式处理。

获取原文
获取原文并翻译 | 示例

摘要

A seamless and intuitive search capability for the vast amount of datasets generated by scientific experiments is critical to ensure effective use of such data by domain specific scientists. There exists a critical need for an easy-to-use and scalable framework, specialized for scientific data. The work in this thesis makes use of the MapReduce model in XML metadata indexing for scientific datasets We present an indexing structure that scales well for large-scale MapReduce processing. We present performance results using two MapReduce implementations, Apache Hadoop and LEMO-MR, to emphasize the flexibility and adaptability of our framework in different MapReduce environments.
机译:对科学实验生成的大量数据进行无缝直观的搜索功能对于确保特定领域的科学家有效利用此类数据至关重要。迫切需要专门用于科学数据的易于使用且可扩展的框架。本文的工作在科学数据集的XML元数据索引中利用了MapReduce模型。我们提出了一种索引结构,该结构可以很好地进行大规模MapReduce处理。我们使用两种MapReduce实现(Apache Hadoop和LEMO-MR)来介绍性能结果,以强调我们的框架在不同MapReduce环境中的灵活性和适应性。

著录项

  • 作者

    Dede, Elif.;

  • 作者单位

    State University of New York at Binghamton.;

  • 授予单位 State University of New York at Binghamton.;
  • 学科 Computer Science.
  • 学位 M.S.
  • 年度 2011
  • 页码 44 p.
  • 总页数 44
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 水产、渔业;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号