【24h】

Implementation of a Container-Based Interactive Environment for Big-Data Analysis on Supercomputer

机译:超级计算机上大数据分析的基于容器的交互环境的实现

获取原文

摘要

In this work, we present an environment able to support users who perform big data analysis using distributed and parallel framework to web applications. JupyterHub and Jupyter Enterprise Gateway were used to develop user code in web environment, and Apache Spark is applied as a distributed and parallel framework. The spark cluster deployed at runtime works with Kubernetes as resource management application to maximize the use of resources on the backend and hence all components are container-based. We install all these customized components one of the largest supercomputer, fifth generation supercomputer, NURION, of KISTI. LDAP authenticator plugin and hostPath type volumes are employed to authenticate users of supercomputer and to bind storage respectively. This allows users to perform spark-based big data analysis on the supercomputer through the web interface with interactive environment.
机译:在这项工作中,我们提供了一个能够支持使用分布式和并行框架对Web应用程序执行大数据分析的用户的环境。 JupyterHub和Jupyter Enterprise Gateway用于在Web环境中开发用户代码,Apache Spark应用于分布式和并行框架。 在运行时部署的Spark群集与Kubernetes一起使用,作为资源管理应用程序,以最大限度地提高后端资源的使用,因此所有组件都是基于容器的。 我们将所有这些定制的组件安装了最大的超级计算机,第五代超级计算机,尼斯蒂的所有超级计算机之一。 LDAP认证器插件和主机路径类型卷被用于验证超级计算机的用户并分别绑定存储。 这允许用户通过具有交互式环境的Web界面对超级计算机执行基于Spark的大数据分析。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号