首页> 中国专利> 多机系统、用于优化多机系统功耗的方法及装置

多机系统、用于优化多机系统功耗的方法及装置

摘要

本发明提供一种多机系统、用于优化多机系统功耗的方法及装置,通过在确定的用于调整该多机系统功耗的数据处理设备的数量范围内,确定每次搜索的第一试验点和第二试验点两个试验点,使得每一次搜索后都会舍弃功耗值较大的试验点一侧的区间,而以其中该试验点作为下一次搜索核数范围的边界,有效地缩小了核数搜索范围,提高了多机系统的功耗优化效率。

著录项

  • 公开/公告号CN103914121A

    专利类型发明专利

  • 公开/公告日2014-07-09

    原文格式PDF

  • 申请/专利号CN201310001368.5

  • 发明设计人 张帅;宋风龙;王达;张浩;

    申请日2013-01-04

  • 分类号G06F1/32(20060101);

  • 代理机构11205 北京同立钧成知识产权代理有限公司;

  • 代理人刘芳

  • 地址 518129 广东省深圳市龙岗区坂田华为总部办公楼

  • 入库时间 2024-02-19 23:54:05

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-04-19

    授权

    授权

  • 2014-08-06

    实质审查的生效 IPC(主分类):G06F1/32 申请日:20130104

    实质审查的生效

  • 2014-07-09

    公开

    公开

说明书

技术领域

本发明涉及计算机节能技术,尤其涉及一种多机系统、用于优化多机系 统功耗的方法及装置。

背景技术

处理器功耗管理技术是近年来处理器设计的重要课题。随着深亚微米工 艺的进步,漏电功耗已经成为处理器功耗的组成部分。因此,一系列针对减 少处理器漏电功耗(静态功耗)的技术相继诞生。

首先被广泛用于减少处理器漏电功耗的方法是动态功耗管理技术 (Dynamic Power Management,DPM)。DPM先通过关闭空闲的处理器或处 理器核来减少不必要的功耗开销,然后通过任务迁移并关闭负载较低的处理 器或处理器核的方法来减少功耗。

其次,随着动态电压频率缩放技术(Dynamic Voltage and Frequency  Scaling,DVFS)的广泛应用,将DVFS与前述DPM相结合,在关闭负载较 低的处理器或处理器核的同时,提高其他工作核的电压频率,可以做到既节 约功耗又保证性能不受损失。

但是,在保证性能的前提下,并不是频率越高核数越少就能获得较低功 耗。

一方面,频率提高会导致功耗的超线性增长,因此当由频率增加导致的 动态功耗增加大于由关闭处理器核带来的静态功耗降低时,处理器的总功耗 就会增加;另一方面,对于并行性高的程序可以通过增加执行核数并降低频 率来保证性能,但核数增加带来的静态功耗增加大于由频率降低带来的动态 功耗降低时,处理器的总功耗也会增大。因此在保证性能不变的前提下,使 用DVFS的同时调整处理器的执行核数,功耗会随核数的增加出现先降低后 增加的变化趋势。

上述规律对于多核乃至众核处理器上运行大规模多线程程序的情况来 说,如何在一定性能约束下寻找不同程序的最优执行核数的频率,成为功耗 优化管理的最终目标。

目前,涡轮加速器(Turbo boost)技术是英特尔(Intel)主流处理器中 使用的一种功耗管理方法。该技术通过底层硬件进行处理器核的频率调节, 能够对指定的单一核进行频率操作,同时其余的空负载处理器核进入深度睡 眠状态,以达到功耗与性能间的平衡。

但是,Turbo boost技术主要应用于小于或等于8个核的处理器上,面向 的主流处理器的核数较少,当处理器核数规模大于目前的核数时,使用Turbo  boost技术关闭负载低的核并提升负载高的核频率,极有可能出现功耗随核数 的增加出现先降低再增加的情况。并且,该技术针对的应用程序并行度有限, 导致线程数通常小于处理器核数,此时关闭空闲的处理器核虽然可以降低静 态功耗,但是当程序线程数大于处理器核数时,关闭一部分处理器核可能导 致其他处理器核的负载增加,从而无法保证目标性能或者导致功耗增大。

另外一种功耗管理方法是在功耗-核数空间上,使用爬山法搜索最低功耗 所需核数。该方法以某一核数a作为试验点,测得功耗值,然后在a+1个处 理器核上执行,如果功耗大于a个核上测得的功耗值,则下一次试验点为a-1 个核;若功耗小于a个核上测得的功耗,则下一次试验点的核数为a+2,依 次在核数为a的两侧循环执行,并测得相应的功耗,从中找到最低功耗对应 的处理器核数。

这种方法的缺点是试验点向最低功耗所在核数逼近的速度较慢,每次试 验点都比上一次增加或减少一个核数。随着处理器规模的增大,爬山法搜索 遍历的试验次数也会大大增加,得到最优解的速度较慢。因此该方法的可扩 展性比较差,不能迅速逼近功耗最优值。

发明内容

本发明实施例提供一种多机系统、用于优化多机系统功耗的方法及装置, 用于提高多机系统的功耗优化效率。

第一个方面,本发明实施例提供一种用于优化多机系统功耗的方法,包 括:

确定多机系统中用于调整所述多机系统功耗的数据处理设备的数量范 围,所述数量范围的最小值为下界,最大值为上界;

在所述数量范围内进行搜索,确定第一试验点和第二试验点;所述第一 试验点、第二试验点均为数据处理设备的数量,且所述第一试验点与所述第 二试验点之和等于所述上界与所述下界之和;

根据所述第一试验点和第二试验点关闭所有非执行数据处理设备,并逐 步降低剩余数据处理设备的频率,以满足目标性能。

第二个方面,本发明实施例提供一种用于优化多机系统功耗的装置,包 括:

范围确定单元,用于确定多机系统中用于调整所述多机系统功耗的数据 处理设备的数量范围,所述数量范围的最小值为下界,最大值为上界;

试验点确定单元,用于在所述数量范围内进行搜索,确定第一试验点和 第二试验点;所述第一试验点、第二试验点均为数据处理设备的数量,且所 述第一试验点与所述第二试验点之和等于所述上界与所述下界之和;

性能调整单元,用于根据所述第一试验点和第二试验点关闭所有非执行 数据处理设备,并逐步降低剩余数据处理设备的频率,以满足目标性能。

第三个方面,本发明实施例提供一种多机系统,包括多机系统本体及上 述用于优化多机系统功耗的装置,所述装置用于优化所述多机系统本体的功 耗。

本发明实施例提供的多机系统、用于优化多机系统功耗的方法及装置, 通过在确定的用于调整该多机系统功耗的数据处理设备的数量范围内,确定 每次搜索的第一试验点和第二试验点两个试验点,使得每一次搜索后都会舍 弃功耗值较大的试验点一侧的区间,而以其中该试验点作为下一次搜索核数 范围的边界,有效地缩小了核数搜索范围,提高了多机系统的功耗优化效率。

附图说明

图1为本发明实施例提供的一种用于优化多机系统功耗的方法的流程 图;

图2为本发明实施例提供的另一种用于优化多机系统功耗的方法的流程 图;

图3为本发明实施例提供的一种用于优化多机系统功耗的装置的结构示 意图;

图4为本发明实施例一种多机系统的结构示意图。

具体实施方式

图1为本发明实施例提供的一种用于优化多机系统功耗的方法的流程 图。本实施例所提供的方法可通过在多机系统中增加一个装置来实现,如在 多机系统中设置一个功能模块来实现。或者另外设置一个装置来实现该方法。 如图1所示,该方法包括:

步骤11、确定多机系统中用于调整该多机系统功耗的数据处理设备的数 量范围,该数量范围的最小值为下界,最大值为上界。

其中,多机系统可为多核处理器,也可为具有多个处理器的系统,还可 为具体有多个可独立调节频率的设备的系统等。

步骤12、在上述数量范围内进行搜索,确定第一试验点和第二试验点; 该第一试验点、第二试验点均为数据处理设备的数量,且该第一试验点与该 第二试验点之和等于所述上界与所述下界之和。

步骤13、根据上述第一试验点和第二试验点关闭所有非执行数据处理设 备,并逐步降低剩余数据处理设备的频率,以满足目标性能。

本实施例中,通过在确定的用于调整该多机系统功耗的数据处理设备的 数量范围内,确定每次搜索的第一试验点和第二试验点两个试验点,使得每 一次搜索后都会舍弃功耗值较大的试验点一侧的区间,而以其中该试验点作 为下一次搜索核数范围的边界,有效地缩小了核数搜索范围,提高了多机系 统的功耗优化效率。

上述步骤11中,确定多机系统中用于调整所述多机系统功耗的数据处理 设备的数量范围可包括:确定所述多机系统中用于调整所述多机系统功耗的 数据处理设备的初始数量范围。

具体地,确定所述多机系统中用于调整所述多机系统功耗的数据处理设 备的初始数量范围,可包括:

若所述多机系统中运行的线程数大于所述多机系统中所有数据处理设备 的数量,则所述初始数量范围的最小值为0,最大值为所述多机系统中所有 数据处理设备的数量;

若所述多机系统中的总线程数或运行的线程数小于所述多机系统中所有 数据处理设备的数量,则所述初始数量范围的最小值为0,最大值为所述多 机系统中运行的线程数。

上述步骤12中,在所述数量范围内进行搜索,确定第一试验点和第二试 验点,可包括:

计算a=(X+Y)×m,b=(X+Y)×(1-m);其中,a为所述第一试验点, b为所述第二试验点,0<m<1,X为所述上界,Y为所述下界,a、b、X、Y 均为变量;

用所述a个数据处理设备执行所述多机系统中的所有线程,并测得所述 多机系统的功耗A;

用所述b个数据处理设备执行所述多机系统中的所有线程,并测得所述 多机系统的功耗B;

比较所述A和B;

若|A-B|<w,则执行所述根据所述第一试验点和第二试验点关闭所有非执 行数据处理设备,其中,w为第一预定值;

若|A-B|>=w,则判断是否|a-b|<e;

若|a-b|<e,则执行所述根据所述第一试验点和第二试验点关闭所有非执行 数据处理设备,其中,e为第二预定值;若|a-b|>=e,则判断是否I>=d;

若I>=d,则执行所述根据所述第一试验点和第二试验点关闭所有非执行 数据处理设备,其中,I为循环次数,初始值为0,d为第三预定值;

若I<d,且A>B,a<b,则计算I=I+1,Y=a,a=b,b=X+Y-a;A=B,然 后执行所述用所述b个数据处理设备执行所述多机系统中的所有线程,并测 得所述多机系统的功耗B;

若I<d,且A>B,a>b,则计算I=I+1,X=a,a=b,b=X+Y-a;A=B,然 后执行所述用所述b个数据处理设备执行所述多机系统中的所有线程,并测 得所述多机系统的功耗B;

若I<d,且A<B,a<b,则计算I=I+1,X=b,a=a,b=X+Y-a;然后执行 所述用所述b个数据处理设备执行所述多机系统中的所有线程,并测得所述 多机系统的功耗B;

若I<d,且A<B,a>b,则计算I=I+1,Y=b,a=a,b=X+Y-a;然后执行 所述用所述b个数据处理设备执行所述多机系统中的所有线程,并测得所述 多机系统的功耗B。

上述步骤13中,根据所述第一试验点和第二试验点关闭所有非执行数据 处理设备,可包括:

计算Z-(a+b)/2,其中Z为所述多机系统中数据处理设备的总数;

关闭所述多机系统中Z-(a+b)/2个数据处理设备。

下面以具有N个核的多核处理器为例,对用于优化多机系统功耗的方法 作进一步详细说明。

在每次执行试验点核数时,若该试验点核数大于上一个试验点执行的核 数,需要将一部分等待执行的线程迁移至启动并空闲的处理器核上;若该试 验点核数小于上一个试验点执行的核数,需要将即将关闭的处理器核上执行 的线程迁移至其他活动的处理器核上,并尽量做到每个活动的处理器核的负 载平均分配。

参见图2,优化多核处理器功耗的方法包括以下步骤:

步骤21、将多核处理器中运行的程序充分并行化,确定多核处理器中用 于调整该多核处理器的核的初始数量范围[Y,X],即确定X和Y的初始值。 并且,设置I=0,其中I为循环次数。

其中,X为核数上界,Y为核数下界。

例如,若所运行程序的线程总数大于多核处理器中核的总数N,则确定 核的初始数量范围为0到总核数,即[0,N],也就是说,X=N,Y=0。

若所运行程序的线程总数小于多核处理器中核的总数N,则确定核的初 始数量范围为0到线程总数,即[0,线程总数],也就是说,X=线程总数,Y=0。

如果线程总数小于多核处理器中核的总数N,可采用类似传统turbo boost 的方法关闭多核处理器中空闲的核,然后对剩下的核执行步骤22及以后的步 骤,对多核处理器进行功耗优化。

步骤22、计算第一个试验点a=(X+Y)×m,计算第二个试验点b=(X+Y) ×(1-m)。其中,m的选择区间为(0,1)。

这里,以(Y,X)作为最优执行核数的搜索空间,分别在该搜索空间内 选择第一个试验点a、第二个试验点b作为本次搜索中的试验核数。

步骤23、将多核处理器中的a个核作为执行核,将该多核处理器中其他 X-a个核上的的线程迁移至这a个核上,这X-a个核成为非执行核,并关闭这 些非执行核。然后,逐步降低各执行核的频率,直到该多核处理器刚好满足 目标性能,测得该多核处理器此时的功耗A。假设所有核必须运行在相同的 频率上,降低频率时,所有核的频率一同降低。

其中,目标性能为在启动功耗管理机制后使用的目标性能,可预先设定。 如:可以设置一个固定的目标性能,可以设置一个固定的目标性能下限,还 可以设置一个容许性能损失的上限,或者将直接测得的程序在所有可用核正 常执行时多核处理器的性能作为目标性能。

步骤24、将多核处理器中的b个核作为执行核,将该多核处理器中其他 X-b个核上的的线程迁移至这b个核上,这X-b个核成为非执行核,并关闭 这些非执行核。然后,逐步降低各执行核的频率,直到该多核处理器刚好满 足目标性能,测得该多个处理器此时的功耗B。

步骤25、判断功耗A与功耗B差别是否小于一个既定数值,如判断是否 |A-B|<w,若是,执行步骤28;否则,执行步骤26。其中,w为A和B差别 的既定数值。

步骤26、判断a与b差值是否小于一个既定数值,如判断是否|a-b|<ε, 若是,执行步骤28;否则,执行步骤27。其中,ε为差值的既定数值。

步骤27、至此,搜索过程是否达到一个循环次数限制,如判断是否I≥d, 若是,执行步骤28,否则,执行步骤29。其中,d为循环次数的既定数值。

步骤28、得到多核处理器最低功耗所需的核数为(a+b)/2,即确定多核 处理器中执行核的最优数量为(a+b)/2,因此,仅保留(a+b)/2个核作为 执行核,关闭其余所有非执行核,逐步降低执行核的频率,直到刚好满足多 核处理器的目标性能,完成多核处理器的功耗优化。此时的频率即为最低功 耗所需的处理器频率。结束流程。

步骤29、计算I=I+1。

步骤210、比较功耗A和功耗B,判断是否功耗A>功耗B,若是,执行 步骤211;否则,执行步骤214。

步骤211、判断是否a<b,若是,执行步骤212;否则,执行步骤213。

步骤212、将新的核数搜索区间缩小为(a,X),即将核数下界Y设为 a,也就是说Y=a,并且,将当前的b设为新的核数搜索区间中的第一试验点 a即a=b,且设b=X+Y-a。这样,之后不需执行上述步骤23,可直接得到A=B, 然后,执行步骤24,得到新的B值。

步骤213、将新的核数搜索区间缩小为(Y,a),即将核数上界X设为 a,也就是说X=a,将b设为新的核数搜索区间中的第一个试验核数a即a=b。 并且设b=X+Y-a。这样,之后不需执行上述步骤23,可直接得到A=B,然后, 执行步骤24,得到新的B值。

步骤214、判断是否a<b,若是,执行步骤215;否则,执行步骤216。

步骤215、将新的核数搜索区间缩小为(Y,b),即将核数上界X设为 b,也就是说X=b,将a仍设为新的核数搜索区间中的第一个试验核数a即a=a。 并且设b=X+Y-a。这样,A值不变,之后不需执行上述步骤23。然后,执行 步骤24,得到新的B值。

步骤216、将新的核数搜索区间缩小为(b,X),即将核数下界Y设为 b,也就是说Y=b,将a仍设为新的核数搜索区间中的第一个试验核数a即a=a。 并且设b=X+Y-a。这样,A值不变,之后不需执行上述步骤23。然后,执行 步骤24,得到新的B值。

当执行完上述步骤28,多机系统的功耗达到最低后,若存在以下任意一 种情况时,可再次执行上述步骤21~步骤216,对多机系统进行功耗优化:

a、多核处理器所运行的线程数发生改变;

b、多线程程序的负载发生改变;

c、功耗管理机制启动时;

d、当改变设定的目标性能时。

上述实施例中,通过确定每次搜索的两个试验点a和b,使得每一次搜索 后都会舍弃功耗值较大的试验点一侧的区间,而以其中该试验点作为下一次 搜索核数范围的边界,从而有效地缩小了核数搜索范围。并且,通过循环执 行搜索来不断缩小核数搜索范围,直到达到停止搜索的条件为止。这样,若 循环中每次搜索所使用的分数m都一样,则下一次搜索中没有作为边界的试 验点仍可以作为试验点,而且试验所得功耗可以直接使用上一次测得的结果, 可以在每次循环中节省一次执行测量。

采用上述实施例提供的技术方案,首先,在功耗-核数空间上可以快速判 断需要舍弃的搜索区间,并且每次试验点的功耗比较都可以使用一个上一次 测得的功耗值,减少了搜索测量的开销,并迅速降低了需要搜索的空间。其 次,在找到最低功耗所需的核数和频率的同时,可以采取关闭不需要执行程 序的处理器核来节省静态功耗,也可以在不需要执行本程序的处理器核上执 行其他程序,大幅提高了处理器的利用率,提高处理器的能效。最后,可以 针对某一类应用程序设计专用处理器,根据程序的特征找到最低功耗所需的 核数和频率,指导芯片的设计,可以有效控制芯片规模,大幅节省片上硬件 开销。

图3为本发明实施例提供的一种用于优化多机系统功耗的装置的结构示 意图。本实施例提供的装置用于实现上述图1所示的方法,如图3所示,该 装置包括:范围确定单元31、试验点确定单元32和性能调整单元33。

范围确定单元31用于确定多机系统中用于调整所述多机系统功耗的数 据处理设备的数量范围,所述数量范围的最小值为下界,最大值为上界。

试验点确定单元32用于在所述数量范围内进行搜索,确定第一试验点和 第二试验点;所述第一试验点、第二试验点均为数据处理设备的数量,且所 述第一试验点与所述第二试验点之和等于所述上界与所述下界之和。

性能调整单元33用于根据所述第一试验点和第二试验点关闭所有非执 行数据处理设备,并逐步降低剩余数据处理设备的频率,以满足目标性能。

范围确定单元31可具体用于确定所述多机系统中用于调整所述多机系 统功耗的数据处理设备的初始数量范围。

进一步地,范围确定单元31可具体用于:

若所述多机系统中运行的线程数大于所述多机系统中所有数据处理设备 的数量,则所述初始数量范围的最小值为0,最大值为所述多机系统中所有 数据处理设备的数量;

若所述多机系统中的总线程数或运行的线程数小于所述多机系统中所有 数据处理设备的数量,则所述初始数量范围的最小值为0,最大值为所述多 机系统中运行的线程数。

可选地,试验点确定单元32可具体用于:

计算a=(X+Y)×m,b=(X+Y)×(1-m);其中,a为所述第一试验 点,b为所述第二试验点,0<m<1,X为所述上界,Y为所述下界,a、b、X、 Y均为变量;

用所述a个数据处理设备执行所述多机系统中的所有线程,并测得所述 多机系统的功耗A;

用所述b个数据处理设备执行所述多机系统中的所有线程,并测得所述 多机系统的功耗B;

比较所述A和B;

若|A-B|<w,则执行所述根据所述第一试验点和第二试验点关闭所有非执 行数据处理设备,其中,w为第一预定值;

若|A-B|>=w,则判断是否|a-b|<e;

若|a-b|<e,则执行所述根据所述第一试验点和第二试验点关闭所有非执行 数据处理设备,其中,e为第二预定值;若|a-b|>=e,则判断是否I>=d;

若I>=d,则执行所述根据所述第一试验点和第二试验点关闭所有非执行 数据处理设备,其中,I为循环次数,初始值为0,d为第三预定值;

若I<d,且A>B,a<b,则计算I=I+1,Y=a,a=b,b=X+Y-a;A=B,然 后执行所述用所述b个数据处理设备执行所述多机系统中的所有线程,并测 得所述多机系统的功耗B;

若I<d,且A>B,a>b,则计算I=I+1,X=a,a=b,b=X+Y-a;A=B,然 后执行所述用所述b个数据处理设备执行所述多机系统中的所有线程,并测 得所述多机系统的功耗B;

若I<d,且A<B,a<b,则计算I=I+1,X=b,a=a,b=X+Y-a;然后执行 所述用所述b个数据处理设备执行所述多机系统中的所有线程,并测得所述 多机系统的功耗B;

若I<d,且A<B,a>b,则计算I=I+1,Y=b,a=a,b=X+Y-a;然后执行 所述用所述b个数据处理设备执行所述多机系统中的所有线程,并测得所述 多机系统的功耗B。

可选地,性能调整单元33可包括:数量计算子单元331和设备关闭子单 元332。

数量计算子单元331用于计算Z-(a+b)/2,其中Z为所述多机系统中数 据处理设备的总数;

设备关闭子单元332用于关闭所述多机系统中Z-(a+b)/2个数据处理 设备。

图4为本发明实施例一种多机系统的结构示意图。如图4所示,该多机 系统可在现有多核处理器、多处理器系统、多设备系统等基础上增加了功耗 优化功能,即包括多机系统本体41和优化装置42。多机系统本体41可为现 有的多核处理器、多处理器系统、多设备系统等。优化装置42可为图3所示 的任意一种用于优化多机系统功耗的装置,用于优化所述多机系统本体41的 功耗。

本发明实施例还给出一种计算机程序产品,该计算机程序产品包括计算 机可读介质,该可读介质包括第一组程序代码,用于执行上述图1所示方法 中的步骤:

确定多机系统中用于调整所述多机系统功耗的数据处理设备的数量范 围,所述数量范围的最小值为下界,最大值为上界;

在所述数量范围内进行搜索,确定第一试验点和第二试验点;所述第一 试验点、第二试验点均为数据处理设备的数量,且所述第一试验点与所述第 二试验点之和等于所述上界与所述下界之和;

根据所述第一试验点和第二试验点关闭所有非执行数据处理设备,并逐 步降低剩余数据处理设备的频率,以满足目标性能。

可选地,确定多机系统中用于调整所述多机系统功耗的数据处理设备的 数量范围,包括:

确定所述多机系统中用于调整所述多机系统功耗的数据处理设备的初始 数量范围。

可选地,确定所述多机系统中用于调整所述多机系统功耗的数据处理设 备的初始数量范围,包括:

若所述多机系统中运行的线程数大于所述多机系统中所有数据处理设备 的数量,则所述初始数量范围的最小值为0,最大值为所述多机系统中所有 数据处理设备的数量;

若所述多机系统中的总线程数或运行的线程数小于所述多机系统中所有 数据处理设备的数量,则所述初始数量范围的最小值为0,最大值为所述多 机系统中运行的线程数。

可选地,在所述数量范围内进行搜索,确定第一试验点和第二试验点, 包括:

计算a=(X+Y)×m,b=(X+Y)×(1-m);其中,a为所述第一试验点, b为所述第二试验点,0<m<1,X为所述上界,Y为所述下界,a、b、X、Y 均为变量;

用所述a个数据处理设备执行所述多机系统中的所有线程,并测得所述 多机系统的功耗A;

用所述b个数据处理设备执行所述多机系统中的所有线程,并测得所述 多机系统的功耗B;

比较所述A和B;

若|A-B|<w,则执行所述根据所述第一试验点和第二试验点关闭所有非执 行数据处理设备,其中,w为第一预定值;

若|A-B|>=w,则判断是否|a-b|<e;

若|a-b|<e,则执行所述根据所述第一试验点和第二试验点关闭所有非执行 数据处理设备,其中,e为第二预定值;若|a-b|>=e,则判断是否I>=d;

若I>=d,则执行所述根据所述第一试验点和第二试验点关闭所有非执行 数据处理设备,其中,I为循环次数,初始值为0,d为第三预定值;

若I<d,且A>B,a<b,则计算I=I+1,Y=a,a=b,b=X+Y-a;A=B,然 后执行所述用所述b个数据处理设备执行所述多机系统中的所有线程,并测 得所述多机系统的功耗B;

若I<d,且A>B,a>b,则计算I=I+1,X=a,a=b,b=X+Y-a;A=B,然 后执行所述用所述b个数据处理设备执行所述多机系统中的所有线程,并测 得所述多机系统的功耗B;

若I<d,且A<B,a<b,则计算I=I+1,X=b,a=a,b=X+Y-a;然后执行 所述用所述b个数据处理设备执行所述多机系统中的所有线程,并测得所述 多机系统的功耗B;

若I<d,且A<B,a>b,则计算I=I+1,Y=b,a=a,b=X+Y-a;然后执行 所述用所述b个数据处理设备执行所述多机系统中的所有线程,并测得所述 多机系统的功耗B。

可选地,根据所述第一试验点和第二试验点关闭所有非执行数据处理设 备,包括:

计算Z-(a+b)/2,其中Z为所述多机系统中数据处理设备的总数;

关闭所述多机系统中Z-(a+b)/2个数据处理设备。

本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步 骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可 读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而 前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码 的介质。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对 其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通 技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改, 或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并 不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号