首页> 外文OA文献 >Task Scheduling Algorithm to Minimize Recovery Time in Case of Single Node Fault in Multicore Processor System
【2h】

Task Scheduling Algorithm to Minimize Recovery Time in Case of Single Node Fault in Multicore Processor System

机译:多核处理器系统中单节点故障时的任务调度算法,可最大程度地缩短恢复时间

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

本論文では,各計算ノードがマルチコアプロセッサであるような並列処理システムにおいて,ネットワークの輻輳を考慮しつつ,マルチコアプロセッサの単一停止故障時の回復時間を最小化するタスクスケジューリングアルゴリズムを提案する.最近開発されたプロセッサのほとんどはマルチコアであり,マルチコアプロセッサが故障した場合は,その上で実行されているタスクをすべてやり直す必要が発生する.ここでは,リカバリのために,各計算ノードで従来手法に基づくチェックポインティングを行うとを仮定する.1つのノードで互いに依存した計算を長時間行うと,そのプロセッサが故障したときに,最近保存したチェックポイントが失われるため,かなり前のタスクから計算をやり直す必要が生じる.提案手法ではこのようなケースが生じないようなタスクスケジュールを生成する.本手法は並列アルゴリズムとして設計されており,入力サイズが十分大きければ,プロセッサ数が$n$のときに,$O(n)$のスケジュール作成時間のスピードアップが達成できる.シミュレーションと実機4台を使用した実験により提案手法の評価を行い,故障発生時にタスク処理時間を既存手法より最大で約30%程度短縮できる一方,故障が発生していないときのオーバヘッドが実験で用いたいくつかの設定において3%程度に収まることを確認した.
机译:在本文中,我们提出了一种任务调度算法,该算法在考虑网络拥塞的同时,将并行计算系统(其中每个计算节点均为多核处理器)中的多核处理器单次故障的恢复时间最小化。最近开发的大多数处理器都是多核的,当多核处理器出现故障时,有必要重做在其上执行的所有任务。这里,假定在每个计算节点处执行基于传统方法的检查点以进行恢复。如果一个节点长时间执行相互依赖的计算,则当处理器发生故障时,最近保存的检查点将丢失,并且必须从很久以前的任务中重做这些计算。所提出的方法产生了不会引起这种情况的任务时间表。此方法设计为并行算法,并且如果输入大小足够大,则当处理器数量为$ n $时,可以加快计划创建时间$ O(n)$。我们通过在四台真实机器上的仿真和实验对提出的方法进行了评估,当发生故障时,与现有方法相比,任务处理时间最多可缩短约30%,而在实验中使用无故障时的开销。已确认在某些设置中该值在3%以内。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号