首页> 中国专利> 使用周期性热评价的电子装置的维护预测

使用周期性热评价的电子装置的维护预测

摘要

一种用于确定是否执行针对电子装置的维护的方法,包括在基线日期为电子装置的发热部件生成热性能的基线表征。该方法还包括在基线日期后的评估日期生成热性能的评估表征。该方法进一步包括生成包括基线表征和评估表征的历史趋势。另外,该方法包括基于历史趋势和指定的维护参数确定是否执行针对发热部件的维护。

著录项

  • 公开/公告号CN104335133A

    专利类型发明专利

  • 公开/公告日2015-02-04

    原文格式PDF

  • 申请/专利权人 英特尔公司;

    申请/专利号CN201380017289.1

  • 申请日2013-12-19

  • 分类号G06F1/20;

  • 代理机构中国专利代理(香港)有限公司;

  • 代理人周学斌

  • 地址 美国加利福尼亚州

  • 入库时间 2023-12-17 04:02:12

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-08-13

    授权

    授权

  • 2015-03-11

    实质审查的生效 IPC(主分类):G06F1/20 申请日:20131219

    实质审查的生效

  • 2015-02-04

    公开

    公开

说明书

技术领域

所要求保护的主题一般涉及热系统。更具体地,所要求保护的主题涉及用于电子装置的冷却系统。

背景技术

通常,服务器以及其他计算装置使用为整体所必需的冷却系统来管理温度敏感部件。一种冷却方法是强制对流。强制对流冷却涉及在装置内部吸取空气、将空气引导至部件以用于冷却。部件典型地包括散热器,其有助于将热量从部件移走并移到环境空气中,该环境空气被排出装置外。

然而,吸到装置内的空气中包含纤维、灰尘颗粒和其他颗粒。这些颗粒积聚在装置内,引起被称为散热器结垢的情况,这逐渐恶化冷却系统的有效性。解决灰尘积聚的当前方法是执行定期维护以去除灰尘。在某些情况下,空气过滤器可以帮助延长维护周期的长度。但是,空气过滤器通常使灰尘散布在更大的表面区域上,并且仅推迟了不可避免的维护。空气过滤器的使用还引起增加的系统流量阻抗,从而导致系统风扇以更高的速度运行并在冷却该系统方面花费更多的能量。

附图说明

图1是根据所要求保护主题的实施例的电子装置的方框图;

图2是根据所要求保护主题的实施例的中央处理单元(CPU)热堆(thermalstack)的方框图;

图3是根据实施例的针对用以安排热系统维护的方法的流程图;以及

图4是根据所要求保护主题的实施例的示例计算机系统的方框图。

遍及本公开和附图使用相同的数字来引用相同的部件和特征。100系列中的数字指代最初出现在图1中的特征;200系列中的数字指代最初出现在图2中的特征;等等。

具体实施方式

在下面的详细描述中,阐述了许多具体细节,以便提供全面的理解。然而,对本领域技术人员来说将显而易见的是,实施例可以在没有这些具体细节的情况下被实践。在其他实例中,以方框图形式而非详细地示出公知的结构和装置,以便避免使实施例难理解。

说明书中对“一个实施例”或“实施例”的引用意味着连同实施例一起描述的特定的特征、结构或特性被包括在至少一个实施例中。说明书中各个地方中用语“在一个实施例中”的出现不一定都指的是相同的实施例。

典型地,数据中心针对数据中心中的所有服务器以定期间隔安排维护。维护通常包括从散热器清洁灰尘和颗粒。定期维护有助于确保服务器保持在热力目标(power thermal target)内。热力目标可以是针对致力于维持环境温度的功率量的预算。然而,这种方法是昂贵的,因为正运行在热力目标内的许多系统以得到保养而告终。

有利的是,当数百或数千服务器被部署在数据中心中,并且数据中心操作者或所有者希望最小化停机时间(down-time)时,有可能尽可能地推迟维护,除非功耗成为一个因素。在那时,清洁这些系统可能导致改进的冷却以及降低的风扇功率。

图1是根据所要求保护主题的实施例的电子装置100的方框图。装置100可以是计算装置,例如服务器、台式计算机、笔记本电脑、平板电脑、智能手机等。该装置100包括发热部件102、散热器104、风扇106、热管理器108、以及性能模型110。发热部件102可以是处理器、磁盘驱动器、高功率半导体器件、功率晶体管、光电器件等。发热部件102包括具有热规范114的存储器。温度规范114识别部件102的可靠性限度、功能性限度以及损坏限度。可靠性限度是用以优化冷却和声学效果的温度限度。功能限度是用以优化部件性能和功率管理的温度限度。损坏限度是当达到时会导致部件102被关闭以避免损坏的温度限度。

散热器104是通过将部件的热量向周围空气中耗散来冷却相关联的发热部件102的热交换器。在一些情况下,散热器104与风扇106相连接,该风扇106增加了通过散热器104的气流。风扇106由热管理器108来操作,该热管理器108基于当前的环境温度以及该部件的操作温度来使风扇接通、关断以及设定风扇速度。要注意的是,移动装置(例如电话和平板电脑)使用自然对流冷却,并因此不包括风扇106。

在装置100内部,具有窄风道或其他收缩管道的各种表面可能引起散热器结垢。散热器结垢涉及到来自空气的纤维在散热器104的表面上的聚集。纤维积聚以形成捕捉更精细颗粒的垫子。散热器104变得越阻塞,垫子变得越善于捕捉更小的颗粒。由于结垢,散热器104的热性能恶化。热性能表示散热器104从相关联的部件102转移走热量的能力。

最初,散热器结垢导致风扇速度上的增加,这是由于热管理器108调整速度来将部件温度维持在其指定的限度内。更大的风扇速度导致更高的功耗。典型地,功耗随风扇速度的数学立方而增加。结垢导致热系统增加的流动阻抗。这导致降低的气流和更高的部件温度。风扇速度控制算法增加风扇转速以维持指定的部件温度。以这种方式,即使在散热器结垢的状态中,增加的风扇速度也维持足够的气流。

如果风扇以其最大速度操作来维持部件温度,则任何附加的结垢会导致作为节流的结果的部件102的性能退化。节流涉及减少处理(例如,CPU处理)的速率以限制由部件102生成的热量。热系统的进一步退化可能导致部件102关闭以防止过热。

在一个实施例中,热管理器108生成热系统的性能模型110。性能模型110包括热系统的基线114和周期性评估116。基线114和评估116是热系统在基线时期(当新装置100首次被安装并加电时)以及在安排的间隔下的表征。

热系统典型地被设计为没有裕度,使用针对要支持的环境的高应力工作负荷条件。因此,可以通过运行恒定的功率基准来生成基线114和评估116。这个基准提供稳态热性能信息,包括但不限于,部件功耗、部件入口处的空气温度、部件排气口处的空气温度、部件温度以及风扇速度。

性能模型110还包括维护参数118。维护参数118指定为安排维护指定了条件。参数118可以为功耗、风扇速度、热性能等指定阈值,超出这些阈值将安排维护。这些参数可以指定:例如如果恒定功率基线示出了当前评估116中在基线114之上的50%的功率增加,则安排维护。在一个实施例中,热管理器108和性能模型110被实现在装置100的固件中。

热管理器108将热系统的当前评估116与基线114相比较。如果该比较示出了性能模型110落在维护参数118外,则为装置100安排维护。维护可以包括在部件102和散热器104周围从装置100内部去除灰尘,以及更换热系统的材料。

在一个实施例中,热管理器108估计当前评估116和基线114之间的平均功率增加。此外,热管理器108可以推荐维护日期。所推荐的维护日期在部件102将在维护参数118之外进行操作之前,并且可以基于平均功率增加,或基于对于超出部件的热规范的预计时间。在每个评估期间,例如入口温度、部件温度、风扇速度、部件功率、系统功率等参数的值被存储以创建历史趋势。该历史趋势被用于预计将在被预期超出部件的热规范之前过去的时间量。如果该预计时间将在下一个安排的评估之前结束,则发出警报以执行维护。

图2是根据所要求保护主题的实施例的中央处理单元(CPU)热堆200的方框图.CPU热堆200包括由热界面材料1和2(TIM1和TIM2)分离的CPU封装202和散热器204,以及集成驱热片(integrated heat spreader,IHS)206。CPU封装202包括IHS 206、基板210上的CPU 208,该基板210插入到母板214的插座212中。TIM1是CPU和IHS 206之间的热界面材料。TIM2是CPU封装202和散热器204之间的热界面材料。

随着时间的推移,TIM1和TIM2可能会退化,从而使热系统的有效性退化。在这种情况下,从部件102去除灰尘不提供如所预期的那样多的在热性能上的改进。在一个实施例中,在从部件102去除灰尘后,热管理器108生成评估116,以确定热系统是否符合热规范114。如果不是,则热管理器108安排维护以更换TIM2,并且如果TIM1已经退化超出指定的参数118,则可能更换该部件本身。

图3是根据实施例的安排热系统维护的方法300的流程图。该方法开始于块302处,其中为特定的部件102运行基线基准。在块304处,基于该基准生成基线114。

块306-316以定期安排的评估间隔进行重复,直至性能模型110超出维护参数118。在块308处,执行评估基准。评估基准被用于生成评估116。存储例如入口温度、部件温度、风扇速度等参数的值以创建历史趋势。

在块310处,热管理器108生成由基线114和评估116示出的历史趋势。热管理器108将评估参数值的历史保持为评估日期的函数。像这样的历史数据被用来评价各种参数将如何趋向,以及被用在预计日期方面,在该日期下,执行维护可以保持发热部件102操作在维护参数118内。

基于历史趋势,在块312处,热管理器确定基线114和每个相继的评估116之间的平均功率增加。在块314处,热管理器108估计还有多久热系统将操作在维护参数118之外。由基线114和评估116示出的历史趋势被用于确定在预期超出部件的热规范之前过去的时间量。如果这个时间是在下一个安排的评估之后,则在块316处,生成报告,该报告包括但不限于,平均功率增加、估计的维护日期,以及预计的风扇转速增加。如果预计的时间在下一个安排的评估之前,则方法300流向块318,其中发出警报以在容纳该部件的装置上执行维护。

在块320处,可以执行维护。例如,清洁散热器104。

在块322处,可以运行新的基准以生成新的评估116。在块324处,热管理器确定TIM2是否将被更换。如果TIM2被更换,则可以生成新的评估116,以确定是否由于TIM1的退化而更换部件102本身。TIM1是不可更换的。

图3中所示的过程可以在任何合适的硬件中被实现,硬件包括逻辑电路、被配置为执行计算机可读指令的一个或多个处理器,等等。

图4是根据实施例的示例计算机系统400的方块图。该计算机系统可以包括但不限于服务器、台式计算机、笔记本电脑、平板电脑、智能手机等。虽然未示出,但计算机系统400可以从直流(DC)源(例如电池)或从交流(AC)源(例如,通过连接到电源插座)接收电力。计算机系统400包括耦合到总线404的中央处理单元(CPU)或处理器402,该总线404提供与系统400的其他部件的连接性。

处理器402可以包括连接到主存储器404的存储器控制器(未示出)。主存储器404可以存储数据和由处理器402或系统400内的任何其他部件执行的指令序列。在一个实施例中,主存储器404包括计算机可读介质,例如,易失性存储器和非易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、闪存等。

易失性存储器可以包括随机存取存储器(RAM),诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双倍数据速率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、DRAM(SLDRAM)、直接RAM(RDRAM)、直接动态RAM(DRDRAM)、动态RAM(RDRAM)。

总线404可以被连接到外围部件互连(PCI)总线408。PCI总线408可以在处理器402与例如音频装置410和磁盘驱动器412等外围装置之间提供数据路径。虽然没有示出,但其他装置也可以被连接到PCI总线408。

处理器402和磁盘驱动器412是发热装置的示例,其中的每一个都与散热器414和风扇416连接。CPU热堆418包括处理器402和散热器414。

要理解的是,前述示例中的细节可以被用在一个或多个实施例中的任何地方。例如,上述计算装置的特征可以替代地相对于本文中所描述的方法和计算机可读介质中任一来实现。此外,虽然本文的附图描述了实施例,但所要求保护的主题的实施例并不限于那些示图或对应的描述。例如,流程不需要以本文所说明相同的特定顺序来经过图4的每个所图示的框进行移动。

实施例不限于本文中列出的特定细节。事实上,受益于本公开的本领域技术人员将认识到,可以做出根据前面的描述和附图的许多其他变形。因此,是包括对其的任何修改的以下的权利要求限定了范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号