机译:具有MPI阶段的批量同步应用程序的故障恢复
Auburn Univ, 345 W Magnolia Ave, Auburn, AL 36849 USA;
Univ Tennessee Chattanooga, Chattanooga, TN USA;
Univ Tennessee Chattanooga, Chattanooga, TN USA;
Lawrence Livermore Natl Lab, Livermore, CA USA;
Lawrence Livermore Natl Lab, Livermore, CA USA;
Checkpoint/restart; Fault tolerance; Global-restart; MPI; Temporal context;
机译:使用MPI阶段的批量同步应用程序的失败恢复
机译:EREINIT:适用于批量同步MPI应用程序的可扩展且高效的容错能力
机译:MPI HPC应用程序中用于分层回滚恢复协议的动态集群策略
机译:摘要:用于提高批量同步MPI应用程序可伸缩性的松弛意识轻量级循环调度
机译:美国休闲餐厅细分中失败类别,失败严重程度以及恢复工作对恢复满意度和随之而来的客户忠诚度的影响的比较研究:正义理论的应用
机译:肝切除术后肝衰竭与大肠癌同时切除和同步肝转移相比
机译:ER EINIT:对批量同步MPI应用的可扩展和高效的容错