首页> 外国专利> FAILURE RECOVERY FOR TRANSPLANTING ALGORITHMS FROM CLUSTER TO CLOUD

FAILURE RECOVERY FOR TRANSPLANTING ALGORITHMS FROM CLUSTER TO CLOUD

机译:从群集到云的移植算法的故障恢复

摘要

A method (400) of providing failure recovery capabilities to a cloud environment (10) for scientific HPC applications. An HPC application with MPI implementation extends the class of MPI programs to embed the HPC application with various degrees of fault tolerance. An MPI fault tolerance mechanism realizes a recover-and-continue solution. If an error occurs, only failed processes re-spawn, the remaining living processes remain in their original processors/nodes (12, 14, 16), and system recovery costs are thus minimized.
机译:一种为科学HPC应用程序向云环境(10)提供故障恢复能力的方法(400)。具有MPI实现的HPC应用程序扩展了MPI程序的类,以将HPC应用程序嵌入具有不同程度的容错能力。 MPI容错机制可实现恢复并继续解决方案。如果发生错误,则仅重生失败的进程,其余的活动进程保留在其原始处理器/节点(12、14、16)中,从而将系统恢复成本降至最低。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号