首页> 中文期刊>计算机科学 >并行复算:一种面向高性能计算的新的容错方法

并行复算:一种面向高性能计算的新的容错方法

     

摘要

Checkpointing是高性能计算领域最常用的容错技术.但是,当处理器数目变大时,这种技术的性能迅速恶化.提出一种在并行计算中容忍单进程故障的新方法:并行复算.这种方法的主要特征是利用冗余处理器的计算能力而不是冗余磁盘的存储能力实现低开销的容错.还提出这种方法的一个优化方法,将并行复算与checkpoint技术相结合,以进一步减小容错开销,并通过举例说明如何开发一个基于并行复算以及其优化方法的并行程序.最后通过实验对该方法进行评估.结果显示,当处理器数目变大时,并行复算的开销低于checkpointing,其优化方法能提供优于并行复算的性能.

著录项

  • 来源
    《计算机科学》|2009年第3期|21-25|共5页
  • 作者单位

    国防科技大学计算机学院并行与分布处理国家重点实验室,长沙,410073;

    国防科技大学计算机学院并行与分布处理国家重点实验室,长沙,410073;

    国防科技大学计算机学院并行与分布处理国家重点实验室,长沙,410073;

    国防科技大学计算机学院并行与分布处理国家重点实验室,长沙,410073;

    国防科技大学计算机学院并行与分布处理国家重点实验室,长沙,410073;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 计算技术、计算机技术;
  • 关键词

    高性能计算; 容错; 并行复算;

  • 入库时间 2022-08-18 04:38:39

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号