首页> 中文期刊> 《计算机研究与发展》 >一种面向大规模并行系统的分组协同检查点算法

一种面向大规模并行系统的分组协同检查点算法

         

摘要

随着大规模并行系统使用着越来越多的处理器,相应地其容错能力也变得越来越重要.协同检查点设置和卷回恢复是此类系统中广泛使用的重要容错技术,但它面临着日益严峻的可扩展性问题.随着处理器数目增加导致设置检查点时需要保存更多的检查点文件,这使得其开销率显著增加.提出一种新的基于分组的协同检查点算法,它使用更好的调度策略使得某一组进程在设置检查点时,其他的进程能够更多地处于计算状态,从而有效地减少了检查点开销.实验表明该算法在系统规模增加时具有良好地可扩展性.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号