system recovery; application program interfaces; message passing; workstation clusters; fault tolerant computing; FTC-Charm++; in-memory checkpoint-based fault tolerant runtime; Charm++; MPI; high performance clusters; application scalability; disk-based method; checkpoint-time; recovery-time; fault-tolerant runtime; in-memory restart; in-disk checkpoint; in-disk restart; AMPI;
机译:MPI程序基于内存的基于应用程序级检查点的迁移
机译:分析过程容错MPI中的故障感知总体性能
机译:DEFT:云中不确定运行时的任务的动态容错弹性调度
机译:FTC-Charm ++:Charm ++和MPI的基于内存检查点的容错运行时
机译:使用InfiniBand,加速器和协处理器为多核集群设计高效的MPI和UPC运行时。
机译:具有传感器和执行器故障的无人机滑模容错控制
机译:Ftc-charm ++:用于魅力++和mpi的基于内存检查点的容错运行时