checkpointing; fault tolerant computing; local area networks; message passing; Berkeley Lab C/R; MPI; checkpoint scheduling; job pause service; local area multicomputer; meantime-to-failure; network connection; transparent fault tolerance;
机译:超标量处理器的透明瞬态容错机制
机译:MPI作业中的MPI作业:在HPC工作流程中启用任务级容错的实用方法
机译:多步骤功能过程调整,以减少因容错故障而导致的服务中无故障发现的产品故障
机译:LAM / MPI + BLCR下的作业暂停服务,用于透明容错
机译:分布式系统中透明并行性和容错性的统一框架。
机译:网格计算系统中一种具有容错能力的蚁群优化算法
机译:LAM / MPI + BLCR下的作业暂停服务可实现透明的容错能力
机译:并行Orca程序中的透明容错