首页> 中国专利> 用于表征热瞬态性能的方法和仪器

用于表征热瞬态性能的方法和仪器

摘要

本发明公开了一种用于评估数据中心内的设备的系统和方法,在一个方面,方法包括接收关于数据中心内的设备的参数,参数包括描述设备的质量的信息,基于所接收的参数计算设备的理想化的热质量,基于理想化的热质量计算在多个时间周期中的第一个时间周期的与设备相关的温度,以及基于理想化的热质量和多个时间周期中的先前时间周期的温度计算多个时间周期中的每个后来的时间周期的温度。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-10-24

    授权

    授权

  • 2015-08-19

    实质审查的生效 IPC(主分类):G05B11/01 申请日:20120921

    实质审查的生效

  • 2015-07-22

    公开

    公开

说明书

背景

发明领域

根据本发明的至少一个实施方式总体上涉及用于数据中心管理和设 计的系统和方法,且更具体地,涉及用于表征数据中心中的设备的理想化 的热质量(thermal mass)的系统和方法。

相关技术的讨论

响应于基于信息的经济不断增长的需求,信息技术网络持续在全球范 围内激增。这种增长的一种表现是集中式的网络数据中心。集中式的网络 数据中心通常由各种信息技术设备组成,所述信息技术设备配置在提供网 络连通性、电源和冷却能力的结构中。设备通常容纳在被称为“机架”的专 用封装件中,该封装件集成这些连通性元件、电源元件和冷却元件。在一 些数据中心配置中,这些排被组织成热通道和冷通道以降低与冷却信息技 术设备相关的成本。在地板下面具有空气室的高架地板通常被用于将冷却 的空气提供给机架。冷空气通过具有开口区域的多孔砖从空气室分配到机 架。

已经开发出了各种过程和软件应用(如可从RI的西金斯敦的施耐德电 气,美国电力转换(APC)公司获得的数据中心管理系统)来协助数据中 心的员工设计和维护高效和有效的数据中心配置。这些工具往往通过活动 来指导数据中心员工,诸如,设计数据中心的结构、在设备安装之前将设 备放置在数据中心内并且在施工和安装完成之后重新放置设备。因此,常 规的工具集给数据中人员工提供标准化的和可预见的设计方法。

概述

根据一个方面,公开了用于评估数据中心内冷却性能的计算机实现的 方法。在一个实例中,该方法包括接收关于数据中心内的设备的参数,该 参数包括描述设备质量的信息,基于所接收到的参数计算设备的理想化的 热质量,基于理想化的热质量计算在多个时间周期中的第一时间周期处 的、与设备相关的温度,并且基于理想化的热质量和多个时间周期中的先 前的时间周期处的温度,计算多个时间周期中的每个后来的时间周期的温 度。

在该方法中,接收关于设备的参数包括接收描述服务器和设备机架中 的至少一个的信息。此外,在该方法中,接收参数包括,通过用户接口来 接收描述以下项中的至少一项的信息:输入温度、功率消耗、气流、比热、 热效率和有效热源相对于质量的位置。该方法还可包括通过用户接口提供 参数的默认值,默认值是设备的热效率和有效热源相对于设备的质量的位 置中的至少一项的预定测量结果。

在该方法中,计算理想化的热质量包括,基于经过设备的内部热传递 特性和设备的物理热性质,计算理想化的热质量。此外,基于经过设备的 内部热传递特性计算理想化的热质量包括,基于以下项中的至少一项计算 理想化的热质量:设备的热传递系数、气流和设备之间的接触表面面积的 量、设备的热效率、设备的时间常数、空气的比热、气流速率以及相对于 设备的质量的有效热源的位置。而且,基于设备的物理热性质计算理想化 的热质量包括,基于设备的比热和设备的质量中的至少一项计算理想化的 热质量。

在该方法中,计算与设备相关的温度包括,计算有效温度和排气温度 并且计算每个后来的时间周期的温度包括计算有效温度和排气温度。

根据另一个方面,公开了用于评估数据中心内的设备的系统。在一个 实例中,系统包括接口和控制器,其中接口被配置为接收关于数据中心内 的设备的参数,这些参数包括涉及设备质量的信息,而控制器被耦合到接 口并且配置为基于所接收的参数计算设备的理想化的热质量,基于理想化 的热质量计算在多个时间周期中的第一时间周期处的、与设备相关的温 度,并且基于理想化的热质量和多个时间周期中的先前的时间周期处的温 度,计算多个时间周期中的每个后来的时间周期的温度。

在该系统中,设备可以包括服务器和设备机架中的至少一个。此外, 接口还可以被配置为通过接收描述以下项中的至少一项的信息来接收参 数:输入温度、功率消耗、气流、比热、热效率和相对于质量的有效热源 的位置中。在一个实例中,接口还可以被配置为提供参数的默认值,默认 值是设备的热效率和有效热源相对于设备的质量的位置中的至少一项的 预定测量结果。

在该系统中,控制器还可以被配置为:基于经过设备的内部热传递特 性和设备的物理热性质,计算理想化的热质量。此外在该系统中,控制器 可以被配置为,通过基于以下项中的至少一项计算理想化的热质量来基于 经过设备的内部热传递特性计算理想化的热质量:设备的热传递系数、气 流和设备之间的接触表面面积的量、设备的热效率、设备的时间常数、空 气的比热、气流速率以及相对于设备的质量的有效热源的位置中。

在该系统中,控制器还可以被配置为:通过基于设备的比热和设备的 质量中的至少一项计算理想化的热质量,基于设备的物理热性质计算理想 化的热质量。控制器还可以被配置为:通过计算有效温度和排气温度来计 算与设备相关的温度,并且通过计算有效温度和排气温度来计算每个后来 的时间周期的温度。

根据另一个方面,公开了使用测量仪器测量数据中心内的设备的参数 的方法。在一个实例中,该方法包括接收关于数据中心内的设备的参数, 参数包括描述设备质量的信息,基于估计的理想化的热质量计算多个时间 周期中的每个时间周期的估计的输出温度,使用测量仪器以预定速率改变 与设备相关的气流速率和功率消耗,使用测量仪器改变多个时间周期上的 设备的输入温度,使用测量仪器来测量经过使用测量仪器的设备的排气的 气流的输出温度,并且计算更新的理想化的热质量,使得估计的输出温度 被配置为等于所测量的输出温度。

该方法还可包括,基于经过设备的内部热传递特性和设备的物理热性 质计算估计的理想化的热质量。在一个实例中,该方法还包括增加设备的 气流和功率消耗直到达到最大气流和最大功率消耗值,并且测量多个时间 周期中的每个时间周期的输出温度。此外,该方法还可包括计算相对于设 备质量的有效热源的位置,使得估计的输出温度被配置为等于所测量的输 出温度。

附图的简要说明

附图不是旨在按比例绘制。在附图中,在各个图中示出的每个相同的 或几乎相同的组件由相似的数字表示。为了清晰的目的,并不是每个组件 都可以在每幅图中被标记。在附图中:

图1是计算机系统的一个实例的框图,使用该计算机系统可以实现根 据本发明的各个方面;

图2是包括数据中心管理系统的分布式系统的一个实例的示意图;

图3A是可以根据至少一个实例分析的数据中心内的设备的实例的示 意图;

图3B是可以根据至少一个实例分析的数据中心内的设备的实例的示 意图;

图4是根据一个实例的用户界面的图表;

图5是根据一个实例的过程的流程图;

图6A是示出根据至少一个实例所使用的测量仪器的实例的示意图;

图6B是示出根据至少一个实例所使用的测量仪器的组件的实例的图 表;

图6C是示出了根据至少一个实施例所使用的测量仪器的组件的实例 的图表;

图7是根据一个实例的过程的流程图;

图8是根据一个实例的过程的流程图;

图9是比较根据一个实例的至少一个过程的结果的曲线图;以及

图10是比较根据一个实例的至少一个过程的结果的曲线图。

详细说明

根据本发明的至少一些实施方式涉及系统和过程,用户可以通过这些 系统和过程设计和分析数据中心配置。这些系统和过程可以通过允许用户 创建数据中心配置的模型(性能度量(metrics)可以根据所述模型确定) 来促进这种设计和分析活动。系统和用户二者都可以利用这些性能度量来 确定满足各种设计目标的可替代的数据中心配置。根据一个实施方式,本 文所描述的系统和方法提供服务器的“理想化的热质量”的特性和测量,其 随后被包括在反映设备的瞬态状态的数据中心的模型中。这样的瞬态状态 理解可以允许数据中心的设计者或操作者使数据中心为可能的瞬态事件 做准备。根据另一个实施方式,本文所描述的实验仪器可以用于测量服务 器的理想化的热质量性质和确定不同的瞬态场景对服务器的不同温度特 性的影响。

如在序号为12/019,109、题目为“评估设备机架冷却的系统和方法 (System and Method for Evaluating Equipment Rack Cooling)”于2008年1 月24日提交的美国专利申请(在本文中称之为“109申请”)和序号为 11/342,300、题目为“用于管理设施功率和冷却的方法和系统(Methods and  Systems for Managing Facility Power and Cooling)”于2006年1月27日提 交的美国专利申请(在本文中称之为“300申请”)中所描述的,其中每一个 被转让给本申请的受让人,并且其中每一个在此通过引用以其整体并入本 文,在现代数据中心内的典型的设备机架将冷却的空气吸入机架的前面并 且将空气从机架的后面排出。设备机架和成排的冷却器通常在数据中心中 以形成交替的冷热通道的交替的前/后布置来排列成排,其中机架的每一排 的前面面对冷通道,而机架的每一排的后面面对热通道。由冷通道分离的 设备机架的相邻排可以称为冷通道集群,并且由热通道分离的设备机架的 相邻排可以称为热通道集群。此外,设备的单排也可以考虑成自身形成冷 和热通道集群。一排设备机架可以是多个热通道集群和多个冷通道集群的 一部分。在本文的说明书和权利要求中,机架中的设备,或机架本身可以 被称为冷却消耗者,并且成排冷却单元和/或机房空调(CRAC)可以被称 为冷却提供者。在引用的申请中,提供了用于分析数据中心内的机架集群 的冷却性能的工具。在这些工具中,可以在不同的布局上执行多个分析以 试图优化数据中心的冷却性能。

数据中心中的设备机架可以包括多个不同类型的装置。在一个实例 中,服务器可以被包括在设备的机架中。例如,服务器可以是物理服务器、 专用服务器或虚拟服务器。物理服务器通常包括运行操作系统的硬件。专 用服务器通常包括运行在物理服务器上的服务应用。例如,专用服务器可 以包括web服务或操作系统上的文件传输协议(FTP)服务,其中服务应 用可以被耦合到物理服务器。虚拟服务器可以包括独立于物理服务器硬件 的服务。在一个实施方式中,每个物理服务器可以有一个专用的服务器操 作系统并且每个物理服务器可以有多个虚拟服务器。虚拟服务器可以与专 用服务器同时(例如在其上)运行。

此外,在序号为PCT/US2011/066877,标题为“瞬态事件对数据中心内 的温度的影响的分析(ANALYSIS OF EFFECT OF TRANSIENT EVENTS  ON TEMPERATURE IN A DATA CENTER)”于2011年12月22日提交的 专利合作条约申请(本文中称之为“PCT/US2011/066877申请”)中,其被 转让给本申请的受让人,并且在此通过引用以其整体并入本文,描述了瞬 态事件的影响,诸如部分冷却系统启动或失败或设备的产热件(heat  producing piece)的启动或损坏。PCT/US2011/066877申请描述了被执行以 预测数据中心设备建议的布局的气流和温度的瞬态事件的影响和气流分 析并且还可以提供关于已安装和计划的数据中心的冷却性能的预测。

根据当前实施方式的本文所公开的各个方面,它们在应用上并不限制 于以下描述中阐述或在附图中示出的构造的细节和组件的布置。这些方面 能够假设有其它实施方式或能够被实现或以不同的方式实施。本文提供的 特定实现的实施例只用作说明的目的而且并不旨在限制。特别是,关于任 何一个或多个实施方式中讨论的动作、元素和特征并不旨在被排除在任何 其他实施例中的相似的作用之外。

例如,根据本发明的一个实施方式,计算机系统被配置为执行本文中 所描述的任何功能,包括但不限于,配置、建模、呈现关于特定的数据中 心配置的信息。此外,可以使用实施方式中的计算机系统来自动地测量数 据中心内的环境参数,和控制设备,诸如冷凝器(chiller)或冷却器以优 化性能。再者,本文中所描述的系统可以被配置为包括或排除本文中所描 述的任何功能。因此实施方式不限于特定的功能或功能组。另外,本文中 所使用的措辞和术语是为了描述并不应该视为限制。在本文中使用的“包 括(including)”、“包括(comprising)”、“具有(having)”、“包含(containing)”、 “包括(involving)”以及它们的变化形式的意思是包含其后所列的项及其 等同物以及附加的项。

计算机系统

根据本发明的实施方式在本文中所描述的各个方面和功能可以被实 现为一个或多个计算机系统上的硬件或软件。目前应用中存在计算机系统 的很多实例。这些实例包括网络电器、个人计算机、工作站、主机、网络 客户端、服务器、媒体服务器、应用服务器、数据库服务器以及web服务 器,等等。计算机系统的其它实例可以包括移动计算装置,诸如手机和个 人数字助理,以及网络设备,诸如负载平衡器、路由器和交换机。此外, 根据本实施方式的各个方面可以置于单个电脑系统上或可被分配在连接 到一个或多个通信网络的多个计算机系统之间。

例如,可以将各个方面和功能分配到一个或多个计算机系统之间,该 一个或多个计算机系统被配置为将服务提供到一个或多个客户端计算机 或作为分布式系统的一部分执行整个任务。此外,各个方面可以在客户端 服务器或多层系统上执行,其包括分配在一个或多个执行各种功能的服务 器系统之间的组件。因此,不局限于在任何特定系统或系统组上执行实施 方式。此外,可以在软件、硬件或固件或它们的任何组合中实现各个方面。 因此,根据本实施方式的各个方面可以使用多种硬件和软件、配置在方法、 行为、系统、系统元件和组件内实现,且实施方式不受限于任何特定的分 布式结构、网络或通信协议。

图1示出了其中可以实施根据本实施方式的各个方面和功能的分布式 计算机系统100的框图。分布式计算机系统100可以包括一个或多个计算 机系统。例如,如图所示,分布式计算机系统100包括计算机系统102、 104和106。如图所示,计算机系统102、104和106可以由通信网络108 相互连接,并且可以通过通信网络108交换数据。网络108可以包括任何 通信网络,计算机系统可以通过该通信网络交换数据。为了使用网络108 交换数据,计算机系统102、104和106以及网络108可以使用包括令牌 环、以太网、无线以太网、蓝牙、TCP/IP、UDP、Http、FTP、SNMP、SMS、 MMS、SS7、Json、Soap和Corba等等的各种方法、协议和标准。为了确 保数据传输是安全的,计算机系统102、104和106可以通过使用包括TLS、 SSL、或VPN等安全技术的多种安全措施来经网络108发送数据。尽管分 布式计算机系统100示出了三个连网的计算机系统,但分布式计算机系统 100可以包括使用任何介质和通信协议连网的任何数量的计算机系统和计 算装置。

可以将根据本实施方式的各个方面和功能实现为在包括图1中所示的 计算机系统102的一个或多个计算机系统中执行的专门的硬件或软件。如 图所描绘的,计算机系统102包括处理器110、存储器(memory)112、 总线114、接口116和储存器118。处理器110可以执行产生操控数据的一 系列指令。处理器110可以是市场上可买到的处理器,诸如,Intel Pentium、 Motorola PowerPC、SGI MIPS、Sun UltraSPARC或Hewlett-Packard PA-RISC 处理器,但可以是任何类型的处理器、多处理器、微处理器、或控制器, 因为许多其他处理器和控制器是可用的。处理器110由总线114连接到包 括一个或多个存储器装置112的其他系统元件。

存储器112可以被用于在计算机系统102的操作期间存储程序和数据。 因此,存储器112可以是较高性能、易失性、随机存取存储器,诸如,动 态随机存取存储器(DRAM)或静态存储器(SRAM)。然而,存储器112 可以包括用于存储数据的任何装置,诸如,磁盘驱动器或其它非易失性、 非暂时性的存储装置。根据本发明的各种实施方式可以将存储器112规划 为特定的结构,且在一些情况中的独特的结构,以执行本文中所公开的各 个方面和功能。

计算机系统102的组件可以由互联的元件(诸如总线114)来耦合。 总线114可以包括一个或多个物理总线,例如,集成在相同机器内的组件 之间的总线,但可以包括任何系统元件之间的任何通信耦合,其包括专用 或标准的计算总线技术,诸如IDE、SCSI、PCI和无线带宽(InfiniBand)。 因此,总线114能够使通信,例如,使数据和指令,在计算机系统102的 系统元件之间交换。

计算机系统102还包括一个或多个接口装置116,诸如,输入装置、 输出装置和组合输入/输出装置。接口装置可以接收输入或提供输出。更具 体的是,输出装置可以提供信息用于外部显示。输入装置可以接受来自外 部源的信息。接口装置的实例包括键盘、鼠标装置、轨迹球、麦克风、触 摸屏、打印装置、显示屏、扬声器、网络接口卡,等等。接口装置允许计 算机系统102与外部实体(诸如用户和其它系统)交换数据和通信。

存储系统118可以包括计算机可读、可写、非易失性的、非暂时性的 存储介质,在该存储介质中存储着定义将由处理器执行的程序的指令。存 储系统118也可以包括记录在介质中或介质上的信息,并且该信息可以由 该程序处理。更具体的是,信息可以存储在特别配置为节约存储空间或增 加数据交换性能的一个或多个数据结构中。指令可以持续地存储为编码的 信号,并且指令可以使处理器执行本文中所描述的任何功能。介质可以例 如是光盘、磁盘或闪存,等等。在操作中,处理器或一些其他控制器可以 使数据从非易失性记录介质读入到另一个存储器,诸如,存储器112,其 相比包括在存储系统118中的存储介质,允许处理器更快地访问信息。存 储器可位于存储系统118或存储器112中,然而,处理器110可以操控存 储器112中的数据,并且然后在处理完成后可将数据复制到与存储系统118 相关的介质。多种组件可以管理介质和集成电路存储元件之间的数据移 动,并且目前描述的实施方式并不限于此。此外,实施方式不限于特定的 存储器系统或数据存储系统。

虽然计算机系统102通过示例的方式被示出为一种可以实践根据本发 明的各个方面和功能的计算机系统示出,但目前公开的实施方式的任何方 面不限于如在图1中所示的计算机系统上实现。可以在具有不同于图1中 所示的结构或组件的一个或多个计算机上实现根据目前公开的实施方式 的各个方面和功能。例如,计算机系统102可以包括特殊编程的,专用硬 件,比如,被定制来执行本文所公开的特定操作的专用集成电路(ASIC)。 而另一个实施方式可以使用Motorola PowerPC处理器运行MAC OS系统X 的若干通用计算装置和运行专有的硬件和操作系统的若干专用的计算装 置,来执行相同的功能。

计算机系统102可以是包括管理包括在计算机系统102中的至少一部 分硬件元件的操作系统的计算机系统。通常,处理器或控制器,如处理器 110,执行操作系统,例如,该操作系统可以是基于Windows的操作系统, 如可从微软公司得到的Windows NT、Windows 2000(Windows ME)、 Windows XP或Windows Vista操作系统,可从苹果计算机得到的MAC OS 系统X操作系统,许多基于Linux操作系统分布中的一个,例如,可从红 帽公司(Red Hat Inc.)获得的企业Linux操作系统,可从SUN微系统公司 得到的Solaris操作系统,或可从各种来源得到的UNIX操作系统。也可以 使用许多其它的操作系统,并且实施例不受限于任何特定的实现。

处理器和操作系统一起定义计算机平台,该计算机平台可以以高级程 序语言编写应用程序。这些组件应用可以是可执行的、中间的代码,例如, C-、字节码或在通信网络例如,互联网上使用通信协议,例如,TCP/IP通 信的解释程序代码。类似地,根据目前公开的实施例的各个方面可以使用 面向对象的编程语言实现,诸如,.Net、SmallTalk、Java、C++、Ada、或 C#(C-Sharp)。也可以使用其它的面向对象的编程语言。可替代的是, 可以使用功能性的、脚本的或逻辑编程语言。

此外,根据目前公开的实施例的各个方面和功能可以在非编程的环境 中实现,所述非编程的环境例如,以HTML、XML、或其它格式创建的文 档,所述文档当在浏览器程序窗口被观看时,呈现图形用户界面的各个方 面、或执行其它功能。此外,根据本发明的各个实施例可以实现为编程元 件或非编程元件,或它们的组合。例如,网页可以使用HTML来实现,而 网页内被访问的数据对象可以用C++来编写。因此,目前公开的实施方式 不限于特定的编程语言,而能够使用任何适合的编程语言。

包括在实施方式中的计算机系统可以执行目前公开的实施方式的范 围之外的附加功能。例如,可以使用现有的商业产品来实现系统的各个方 面,例如,数据库管理系统,诸如,可从西雅图WA的微软得到的SQL 服务器、来自加州,红木岸区的Oracle的Oracle数据库和来自Oracle的 子公司MySQL AB的MySQL、或集成软件,诸如来自纽约阿蒙克的IBM 公司的Web Sphere中间件。然而,例如,运行SQL服务器的计算机系统 能够支持根据目前公开的实施方式的各个方面和各种各样的应用的数据 库。

示例系统的架构

图2示出了包括分布式系统200的物理元件和逻辑元件的环境图。如 图所示,专门地根据目前的公开的实施方式配置分布式系统200。关于图 2中叙述的系统结构和内容仅仅是为了示范的目的并不旨将实施方式限定 为在图2中示出的特定结构。如本领域的技术人员将理解的,许多变体系 统的结构可以建立而不背离目前公开的实施方式的范围。为了提升清晰 度,在图2中选择示出了特定的布置。

信息可以通过使用任何技术在图2中所描绘的元件、组件和子系统之 间流动。例如,这样的技术包括经由TCP/IP协议在网络上传递信息、在 存储器的模块间传递信息以及通过写入文件、数据库或一些其他非易失性 存储装置来传递信息。可以使用其它的技术和协议,而不违背目前公开的 实施方式的范围。

参考图2,系统200包括用户202、接口204、数据中心设计和管理系 统206、通信网络208以及数据中心数据库210。系统200可以允许用户 202,诸如数据中心设计师或其它数据中心员工,与接口204交互以创建 或修改一个或多个数据中心配置的模型。根据一个实施方式,接口204可 以包括底层编辑器(floor editor)和机架编辑器的各个方面,如在序号为 PCT/US08/63675、题目为“用于管理设施功率和冷却的方法和系统 (METHODS AND SYSTEMS FOR MANAGING FACILITY POWER AND  COOLING)”于2008年5月15日提交的专利合作条约申请中所公开的, 通过引用将其整体并入本文(本文中称为“PCT/US08/63675申请”)。在 其它实施方式中,接口204可以使用能够使用户202以拖放的方式设计包 括数据中心或任何其子集的物理布局的表示的模型的专用设施来实现。该 布局可以包括数据中心结构组件以及数据中心设备的表示。如可以在本文 公开的各种实施方式中发现到的是,下文将进一步讨论接口204的特征。 在至少一个实施方式中,系统200通过接口接收关于数据中心的信息,并 且给用户提供数据中心的评估和建议。此外,在至少一个实施方式中,可 以执行优化过程以优化冷却系能和数据中心的能量使用。

如在图2中所示,数据中心设计和管理系统206将数据设计接口204 呈现给用户202。根据一个实施方式,数据中心设计和管理系统206可以 包括如在PCT/US08/63675中所公开的数据中心设计和管理系统。在该实 施方式中,设计接口204可以并入包括在PCT/US08/63675中的输入模块、 显示模块和编码程序模块(builder module)的功能并且可以使用数据库模 块存储和检索数据。

如图所示,数据中心设计和管理系统206可以通过网络208与数据中 心数据库210交换信息。该信息可以包括支持数据中心设计和管理系统206 的特征和功能所需的任何信息。例如,在一个实施方式中,数据中心数据 库210可以包括存储在PCT/US08/63675中所描述的数据中心设备的数据 库中的至少一部分数据。在另一个实施方式中,该信息可以包括支持接口 204所需的任何信息,诸如,一个或多个数据中心的模型配置的物理布局、 包括在模型配置中的冷却提供者的生产和分布特性,模型配置中的冷却消 耗者的消耗特性,以及将要包括在集群中的设备机架和冷却提供者的列 表,等数据。

在一个实施方式中,数据中心数据库210可以存储与冷却提供者的类 型、由每种冷却提供者提供的冷气量以及由冷却提供者提供的冷气温度相 关的信息。因此,例如,数据中心的数据库210包括与特定类型CRAC单 元相关的记录,特定类型CRAC单元额定在68华氏度的温度处以每分钟5, 600立方英尺(cfm)的速率传送气流。此外,数据中心的数据库210可以 存储与一个或多个冷却度量相关的信息,诸如,CRAC的入口温度和出口 温度以及一个或多个设备机架的入口温度和排气温度。可以定期地测量温 度并将其输入系统,或在其它实施方式中,使用耦合到系统200的装置连 续地监控温度。

在另一个实施方式中,数据中心的数据库210可以存储关于计算装置 或IT(信息技术)装置(如,服务器)的类型信息,并且还可以包括关于 服务器的重量的信息、服务器的热容量估计的信息、最大的CPU负载容量 的信息以及其他信息。

数据中心的数据库210可以采取能够在计算机可读介质上存储信息的 任何逻辑结构的形式,包括平面文件、索引文件、层次数据库、关系数据 库或面向对象数据库等结构。通过使用唯一的和外部键关系以及索引,可 以将数据模型化。唯一的和外部键关系以及索引可以在各种字段和表之间 建立,以确保数据完整性和数据交换性能。

在图2中所示的计算机系统,包括数据中心设计和管理系统206、网 络208和数据中心设备的数据库210,其每一个都可以包括一个或多个计 算机系统。如上述关于图1所讨论的,计算机系统可以具有一个或多个处 理器或控制器、存储器和接口装置。在图2中所描绘的系统200的特定配 置只用于说明性的目的并且本发明的实施方式可以在其他情况下实践。本 文所描述的实施方式并不限于特定数量的用户或特定数量的系统。

瞬态热特性

根据一个实施方式,本文所描述的系统和方法提供对服务器的“理想 化的热质量”的特征和测量,该服务器的理想化的热质量的特征和测量后 来被包括在描述瞬态场景的数据中心的数值模型中并且被用在数据中心 的设计和评估中。根据包括在本文中的各个实例,“理想化的热质量”可以 被定义为数据中心的装置随其内部温度和/或内部功率消耗随时间变化的 吸热和放热的能力有关的特性。术语“热质量”有时仅仅被定义为质量的总 热容量,例如,以J/℃为单位。当谈及服务器时,其不仅是这个(潜在的) 重要的热容量,而且是这个热容量如何“到达”经过服务器的气流。我们 使用“理想化的热质量”包括当受到随时间变化的入口温度、内部功率消耗 或气流速率的影响时,影响服务器的内部温度和排气温度的所有的服务器 特性。

在本文所描述的各个实例中,数据中心的装置(例如,服务器)的理 想化的热质量被表征并包括在瞬态数值模型中。然而,要理解的是,数据 中心中的其它设备,包括冷却单元、功率消耗单元(PDU)以及其他装置, 也具有热质量并且可以被包括在瞬态分析中。一旦被确定,热质量可以并 入用于瞬态分析的数值模型中,包括计算流体动力学(CFD)、势流模型 (PFM)、快速流体动力学(FFD)、集结模型、其间的紧凑模型、或其它 数值模型。在PCT/US2011/066877申请中对描述瞬态场景分析的数值模型 的各个实例进行了描述。

根据各个实例,对于需要理解数据中心的各个部分可能在瞬态事件期 间如何快速变热的设计者或操作者而言可能对热质量感兴趣。例如,瞬态 事件可以包括与功率失败相关的冷却损失(和返还)或与信息技术(IT) 负载变化或虚拟化的场景相关的冷却损失(和返还)。

瞬态事件的这样的理解可以允许数据中心的设计者或操作者准备数 据中心以用于潜在的瞬态事件。例如,操作者或设计者可以确定什么设备 连接到备用电源,保持冷冻水的多大的应急电源,或在哪里放置最重要的 服务器或电器。此外,快速地和准确地对热质量的影响建模的能力可以帮 助设计者优化冷却器和其它关于能量使用的基础设施的控制系统。

要理解的是,在给定的数据中心内的服务器机架(每个完整的机架重 量大概是2000-3000磅)导致大量的热质量可用来充当在冷却损失后的散 热片。用于瞬态事件建模的先前的方法,假设数据中心的电源可能只加热 数据中心内的空气,在瞬态计算中忽略了该热质量。从瞬态热模型中排除 该方面可能导致对温度的过分保守的计算。在至少一个实施方式中,排除 质量可能导致预测上升的温度可能比它们在现实中上升的更快。

然而,先前的方法通常将服务器的理想化的热质量排除在数据中心的 瞬态加热计算之外,部分是因为服务器的“理想化的热质量”先前没有以 覆盖全部实例的这样的方式定义。此外,理想化的热质量可能被排除是因 为可能不存在直接的方式来测量服务器的“理想化的热质量”。此外,理想 化的热质量还可能被排除是因为在传统的CFD软件中对服务器充分细化 的建模可能引起太大的且实际要解决的计算密集的模型。

一个用于预测数据中心的瞬态冷却性能的方法包括,假设数据中心内 的所有空气处在完全均匀混合的环境温度中的模型。完全均匀混合的方法 可能是太过于简单化并且可能引起用户错过重要的局部细节或不必要地 超安全标准设计冷却的基础设施。相反地,本文所公开的方法和系统,基 于综合的服务器的理想化定义服务器的理想化的热质量特性,并且更实用 于实现。此外,本文所描述的系统和方法详述了用于实验测量服务器理想 化的热质量的特定的程序,并且还提供了用于将理想化的热质量的影响以 保持模型简单、快速、和实用的方式并入数值模型(例如,CFD模型)的 方法。

如上所述,虽然数据中心内的其它设备(包括冷却单元、PDU、和其 它设备)也具有理想化的热质量,要理解的是,纯粹以质量而论,服务器 通常是最大的贡献者。因此,本文所描述的分析聚焦于服务器的理想化的 热质量。然而,要理解的是,理想化的热质量模型可以包括附加的设备或 其它设备。此外,直接建模技术可能已经存在用于处理其它固体对象,诸 如高架地板结构、墙和柱形体。

根据各个实施方式,需要表征服务器或其他数据中心设备的参数的数 目可取决于应用。本文所描述的应用包括“外部加热”和“内部加热”。 对于“外部加热”应用,环境空气的温度随着时间的推移而变化,而由服 务器或其它数据中心的设备所产生的热负载随着时间的推移是基本均匀 的。对于内部加热应用,由服务器或其它数据中心设备所产生的热负载随 着时间的推移而变化。可能需要这两个应用,可能需要关于服务器的一些 信息,并且可以从基于可用信息测量的或估计的已公布的制造商数据中获 得,在一个实例中,包括服务器的气流速率、服务器的质量、和服务器或 其它数据中心的设备的比热。

对于服务器的外部加热,在服务器的气流速率、质量、和比热之外, 只需要一个额外的参数。一个外部加热的示例的例可以包括冷却电源失败 的场景,该场景可能推动数据中心结构的若干方面的设计。例如,数据中 心的操作者可能想要知道数据中心内的每个机架在遭受特定的冷却故障 事件时需要多久达到某个最大可接受温度。根据一些实例,由服务器的理 想化的热质量负责的再多几分钟的运行时间可以在资产费用、数据中心的 可靠性、以及操作者的信心方面制造出大大的不同。对于内部加热,还需 要另一个参数来表征相对于服务器的质量的热源的位置。理想化的热质量 模型的实例可以包括服务器的启动和关闭以及由于虚拟化引起的负载迁 移。

服务器理想化

根据本文所描述的各个示例,可以使用两个服务器理想化来确定理想 化的热质量:单质量模型或双质量模型。根据一个示例,可以使用单质量 模型来捕获外部加热实例中的理想化的热质量效应。如上面所描述的,当 服务器被建模为以基本均匀的功率消耗操作时,同时外部环境(服务器入 口)的温度变化。

单质量(single-mass)服务器模型

一些实施方式将服务器分析为如在图3A中所示的单质量。根据这些 实施方式,理想化了一维服务器的模型。在这些实施方式中,总服务器的 质量,M位于在服务器的总热量消耗qIT的上游,总热量消耗qIT被添加到 服务器的后面的紧接的上游的气流在单个质量理想化的情况中,质量 M处于均匀的温度Teff并且被分配在整个服务器体积中,使得其通过区域A 和热传递系数h与气流交换热量。

整个服务器产生的瞬时能量平衡为:

     方程(1)

其中,是服务器的质量与比热的乘积并且是空气质量流速 率和比热的乘积。在方程(1)中体现的是位于服务器内瞬时的空气的热 质量和经过服务器的各个边到环境的热传递,相比于模型中的其它项是可 忽略的假设。

仅仅关于质量M自身产生的瞬时能量平衡为:

        方程(2)

其中,为了简单和降低计算开销,我们已经假设来自空气的所有对流 热传递发生在单一温度T输入处。如果T输入被称为时间的方程而不是可能在一 些情况下(例如,线性增加)分析地求解方程(1)和方程(2)。不管怎 样,通过创建便于数值模型的离散模型可以说明T输入的任意变化。我们将 温度的导数近似为如下方程:

        方程(3)

其中是来自先前的时间步骤的Teff。求解方程1-2并且利用方程(3) 产生:

        方程(4)

以及

        方程(5)

其中

τ1≡服务器的热时间常数        方程(6)

以及

τ2≡服务器的热时间常数       方程(7)

然后使用方程(4-7)估计分析中的每个时间步长处的服务器的有效温 度和排气温度。出现在上述分析中的服务器的热时间常数表征服务器发生 瞬态加热或瞬态冷却上的时间尺度。例如,大的时间常数表明非常大的热 质量或与气流进行的慢的热交换,并且因此有效的服务器的温度将随着时 间的推移非常缓慢的变化。当服务器的热时间常数接近于零时,服务器的 排气温度将简化为入口温度加上通常是在稳定的状态下假设的。 时间常数τ1通常随着服务器的气流速率而变化,因为方程(6)中的h随着 流的速率变化。变化的速率被认为是h随着流速率变化到4/5的功率-小于 线性的-并且实际服务器气流往往是固定的或不会大量变化。

双质量服务器模型

为了捕捉服务器内部的散热组件的特定位置或分布的影响,可以将服 务器建模为由内部加热的源的影响有效位置划分的质量的两个部分。要理 解的是,双质量模型也可以用来确定服务器对变化的环境温度的响应,其 中这样的信息是感兴趣的,或可以使用如上所述的加热的方法。图3B示 出了展示为双质量服务器模型的一维服务器的模型。根据各个实例,出于 以下讨论的目的,理想化了一维服务器的模型。在说明的实例中,服务器 具有总的质量M和总的热消耗qIT,其位于沿着服务器的气流方向上的距 离λL。L表示服务器容量的长度并且λ表征相对于服务器容量的热源的位 置。在一个实例中,假设质量M在均匀的温度Teff处并且将质量M在整个 服务器容量中分布,使得它与通过总的面积A和传热系数h的气流进行热 交换。对于理想化的服务器,热传导性可以被表征为相当高。

整个服务器的瞬时能量平衡可以表达为:

        方程(8)

其中M是服务器的质量;

是服务器的全部有效比热;以及

是空气质量的流速率和比热的乘积。

包括在方程(8)中的假设是位于服务器内的瞬时空气的热质量和经 过服务器的各边到环境温度的热传递与模型中的其它项相比是可以忽略 的。

仅仅关于服务器内部的固体质量M的且不包括热源的瞬态能量平衡 可以表达为:

    方程(9)

其中,假设所有到/来自空气发生的对流热传递发生在分别表示热源的 上游和下游T输入和的均匀空气温度处。在由方程(9)表示的理想 化的热质量中,固体质量M可以被表示为包括设置在热源之前的面积A1 和设置在热源之后的面积A2的均匀分布的多空介质。

根据一些实例,如果T输入被认为是时间的方程,则在一些情况(如, 线性增加)中,可能通过分析地求解方程8和方程9来确定理想化的热质 量。在其它实例中,在T输入中的任意的热变量(和其他参数)可以通过创 建离散的模型来进行说明。离散的模型可以包括一个或多个在时间单元中 表达的时间步长。离散的模型可以被近似地用于并入整个数据中心的数值 模型中。在一个实例中,温度的导数可以表达为如下方程:

           方程(10)

其中是来自先前的时间步长的Teff。求解方程(8-9)并且利用方程 (10)产生的服务器的有效温度和服务器的有效排气温度可以表达为:

     方程(11)

以及

      方程(12)

其中,

τ1≡服务器的热时间常数           方程(13)

τ2≡服务器的热时间常数       方程(14)

ΔTIT≡稳定状态的服务器的温度的上升       方程(15)

在一个实例中,稳定状态(或预瞬态事件周期)的起始温度可以表达 为:

          方程(16)

                 方程(17)

方程(11-12)则可以被用来估计在瞬态分析中的每个时间步长处的服 务器的有效温度和排气温度。从上述分析中出现的服务器的热时间常数可 以表征发生在服务器的瞬态加热和瞬态冷却上的时间尺度。例如,大的时 间常数表明有效的服务器的温度随着时间的推移缓慢地变化。在上述实例 中,当服务器的热时间常数接近于零时,服务器的排气温度简单地变为所 期望的稳定条件下的入口温度加上稳定状态的温度的差ΔTIT

时间常数τ1通常随着服务器的气流的速率变化,因为方程(13)中的 h随着流的速率变化。然而,变化的速率被认为是h,随着流的速率变化 为4/5的功率-小于线性功率-并且实际的服务器的气流往往被固定或不大 量的变化。时间常数τ2也可相反于从方程(14)中所见到的流的速率变化。

根据一些实施方式,在由方程(11-12)所描述的分析模型中,时间常 数τ2和稳定状态的温度差ΔTIT可以被视为已知的量。例如,可以确定服务 器的质量,可以基于已知的服务器的布置估计根据一些示例,可以使 用由服务器的制造商或“服务器的实地观测”(例如,分析单独的服务器) 所公布的数据来确定和估计质量和也可以假设称为服务器的功率和气 流的速率可以使用可用的数据确定、测量或估计。随同在数值分析中所使 用的稍微任意的时间步长Δt,剩下的未知数包括时间常数τ1和λ。

此外,当服务器的温度差,ΔTIT随着时间的推移保持不变(并且只有 瞬态影响来自外部环境温度的变化),由方程(11-12)所描述的模型可以 被示出为独立的λ(即,热源的位置),使得时间常数τ1成为唯一剩下的 未知数。虽然展示当λ退出方程(11-12)时的详细的证明没有在本文描 述,但是这种行为的物理原因如下。在通过服务器的温度的量将热源的下 游升高了ΔTIT,空气和热质量间的温度差变更大的同时,整个热质量的温 度也随着热源向服务器的后面运动而降低。在热质量的温度中的这个增加 抵消了更高的空气温度使得由方程(12)预测的服务器的出口的温度不管 λ的值而是相同的。在一些实例中,当服务器的功率或气流(反应在ΔTIT中) 随着时间的推移而变化时,热源的位置不影响出口的温度。在λ=1的一个 情况中,当不存在吸收变化或抑制变化的热源下游的热质量时,T输出简化 为随着ΔTIT变化的“浮点数”。

模型中的热效率

在没有详细的试验数据下,用户也可能很难估计出两个模型中的时间 常数τ1,因为其是量纲量(a dimensional quantity)(例如,在几秒中内)。 在这些实施方式中,并不是所有τ1的值是基于热力学第二定律的考虑而物 理地感知的。因此,在以下描述的实施方式中,服务器的热效率ε被描述 为时间常数τ1的替代。类似于单质量模型,双质量模型的服务器的热效率 是零和一之间的无量纲的数,气流和服务器的质量之间最大可能的热传递 值发生在ε=1处而当ε=0时传递的热量为零。

再次参考图3B,考虑可能发生在气流和没有内部加热的热质量之 间的最大热传递。根据热力学第二定律,T输出不可能被冷却到低于Teff或加 热到高于Teff,但是可以在极限条件下接近该值。因此,基于这个原理, 服务器的热效率可以表达为:

        方程(18)

其在零和一之间清晰地变化。方程(18)可以重写为:

T输出=T输入+ε(Teff-T输入)      方程(19)

比较ε的定义与我们先前得到的方程,可以解出方程(11)中的并 且代入方程(12)中(使用ΔTΠ=0),产生服务器的排气温度表达为:

        方程(20)

比较方程(19)和方程(20)可以产生服务器的热效率,表达为:

ϵ=τ2τ1=hAm·cp             方程(21)

如上所述,服务器的热效率∈的值可以包括0和1之间的任何的值, 并且具有明确的物理解释,并且比直接估计τ1更容易估计。此外,只要服 务器的热效率∈被假设在0和1之间,可以确定物理感知的输入值。

要理解的是,方程(11)和方程(12)可以以ε项的形式重写。然而, 因为方程轻微地更紧凑的用τ1表达,方程(11)和方程(12)仍然可以以 τ1的项来表达。不同于以下关于捕捉用户的输入数据的讨论,在遵循服务 器输入特性的讨论中和方程中使用的τ1总是可以以ε的项重述。

数值数据中心模型的服务器的紧凑描述

图4示出了为数据中心的操作者或设计者提供的包括瞬态参数和稳 定的状态参数的用户接口的一个实例。为了将服务器的理想化的热质量并 入用于瞬态分析的数值模型中,在图4中所示出的参数可以由系统接收。 如上所述,系统可以包括气流求解器,该气流求解器包括任何全领域解决 方案类型,包括CFD、PFM、FFD、集结模型或其间的紧凑模型,包括 其他气流确定方案。

在一些实施方式中,参数可以被提示为由用户输入。在其他的示例中, 稳定状态的参数则可以由系统接收,例如,通过从数据中心接收所测量的 数据。如所示,稳定状态的参数可以包括功率和气流。需要提示由用户输 入瞬态模型(用于稳定状态分析的要求之上的参数和超出用于稳定状态分 析的要求的参数)的其它参数,可以包括服务器的质量、比热、效率ε和 λ。此外,假设比热和空气密度也是由系统已知的值。

在一些情况中,并非在图4中所示出的所有瞬态参数都可以被提示为 由用户输入。在一个实例中,只有质量可以由用户输入,而服务器的比热、 效率和λ值可以被假设。例如,可以基于数据中心的典型值假设比热、热 效率和λ。在这些实施方式中,可能提示用户输入最容易确定的信息并且 用户还能够捕捉合理的近似的理想化的热质量的影响。

根据各个实施方式,使用在图4中示出的接收的输入数据,可以计算 其他需要的参数。例如,可以将空气的质量流的速率计算为容积流率和 密度的乘积。此外,可以以时间常数τ2和服务器效率计算τ1,并且表达为 τ2/ε。

在这些实施方式中,使用所有已知的参数,由方程(11-12)表达的 模型可以用来将服务器的出口温度计算为时间的函数。在瞬态周期的开始 处的每个服务器的质量的温度由方程(16)给出。当瞬态分析进行时,服 务器的出口温度在每个时间步长处轮流更新,这影响数据中心内的温度, 潜在地包括服务器本身的入口的温度。作为在给定的时间步长处达到“融 合”的方案,时间提前一个时间步长并且过程继续直到达到如在图5中示 出的在方法500中总结的瞬态周期的终止。在至少一个实例中,如果到达 预定的阈值,过程可以在达到瞬态周期的终止之前终止。例如,当排气温 度等于或大于最大可允许的温度时,过程可以终止。

在步骤502中,系统接收信息。在上述描述的实例中,信息可以由用 户输入或从数据中心接收并且可以包括与服务器相关的气流和功率分布。 基于接收的信息,可以如上所述确定时间常数τ1和τ2、以及服务器的温度 增加ΔTIT。在步骤504中,瞬态周期在稳定状态处的时间=t0开始。在步骤 506中,启动服务器的有效温度的稳定的状态(或预瞬态事件周期)且服 务器的输出温度可以由方程(16)和方程(17)表达。在步骤508中,考 虑下一个时间步长。在步骤510中,气流求解器使用包括输入温度的数值 模型计算所有数据中心的气流的温度。在步骤512中,服务器的有效温度 和服务器的输出温度使用方程(11)和方程(12)更新。在步骤514中, 系统确定是否已经达到瞬态周期的终止。如果是,方法500终止。如果不 是,考虑下一个时间步长并且方法500返回到步骤508。也可以使用单质 量的方法类似地执行过程。

在一些实例中,可能至少近似地说明τ2或ε随着气流速率的变化以提 高精确度。如果特定的ε被理解为对应于特定的气流速率,则在没有图4 中所示的之外的额外的用户输入下,可以确定这些变量。热传递系数h 则可以被假设为随的速度变化并且可以自动地处理对τ2的影响。在其它 实施方式中,模型可以不包括这些随着气流速率改变的变量。

建模整个机架:多个平行的服务器

通常,数据中心的数值模型的用户可能想要将整个机架建模为一个对 象而不是对填入机架的多个平行操作的服务器分别建模。可以使用方程 (11)和方程(12)的模型与对参数τ1和λ的适当的解读。有效的 机架级的质量Meff、功率和气流(或在体积基础上的Qeff)显然 只是包括机架本身的它们的服务器级的总和的对照物。有效的比热可以被 计算为质量加权的平均:

Mcpeff=1Meff(Σs=1nMscps+MRcpR)      方程(22)

其中n是服务器的数目并且下标“R”指的是机架本身。使用热效率 的定义,机架级的有效值可以是展示为:

ϵeff=1Qeff(Σs=1nQsϵs+QRϵR)=Σs=1nQsϵs+QRϵRΣs=1nQs+QR     方程(23)

其中机架本身的气流速率QR和热效率εR,并不容易被估计出。由于 机架的大的热传递区域,我们可以推测∈R类似于这里所测量的服务器的 εR。鉴于此,我们建议可以忽略架子对热效率的贡献(并且QR=0)。

不幸的是,整个机架的λeff通常随着时间的推移而变化使得其值某种 程度上受限。如上所讨论的,对于许多服务器,λ通常可以接近于零,做 出λeff=0的合理假设。基于上述所呈现的分析实例,我们建议在所有服务 器都具有相同的时间常数τ1=mcp/hA和相同的内部加热速率ΔIT(t)的限制情 况中,λeff降低到对应的服务器值的热容量的加权平均:

λeff=1Meffcpeff(Σs=1nMscpsλs)      方程(24)

理想化的热质量的实验测量

如上所述,为了确定服务器的理想化的热质量性质和τ1,服务器 的入口空气的温度T输入随时间的推移变化。在各个实例中,为了确定表征 质量和热源的相对分布的额外的参数λ,服务器的热负载也变化。而T输入和 λ也可以同时变化,分别运行实验可以更容易确定λ单独的影响,而与其 他参数区分开来。

图6A示出了可以用于测量服务器的理想化的热质量性质和确定随时 间的推移而变化的单独参数的影响的实验仪器600的一个实例。实验仪器 600包括含有加热部分606的进气道608、进气测量部分610、服务器612、 整流部分614、排气道616、和排气测量部分618。具有进气温度的入口 空气602进入实验仪器600,从进气道608流入,经过进气测量部分610, 经过服务器612,到达整流部分614,到达排气道616,并且经过排气测 量部分618,且作为具有排气温度的排出空气604退出。在一个实例中, 仪器可以被半永久性地安装到实验室环境中。在其它实例中,仪器可以被 紧紧地集成并且可便携式地在远程位置很容易地执行测量。

根据一些实例,进气道608包括加热部分606,该加热部分606可以 包括电阻加热线圈或任何其他合适的热源。到服务器的进气温度是可控制 的,使得温度可以随着时间的推移周期的推移变化几度。在一个实例中, 温度可以在几分钟的时间段大约变化20-30℃。然而,要理解的是,进气 温度可以是近似的,并且不需要可控制为特定的温度分布图或甚至是可重 复的。考虑其他的温度和时间周期。在一些实例中,加热部分可以与进气 道608物理地隔离。

图6B示出了更详细的进气测量部分610。在示出的实例中,进气测 量部分610包括热线风速仪,其被配置为在空气进入服务器612之前测量 空气的速度和温度。然而,入口的空气速度和温度可以由其他机械装置测 量。在各个实例中,因为入口的气流602通常比出口的气流604更均匀, 由入口测量部分610测量的速度可比用于计算总的服务器空气速率的目 的的排气测量部分618处的速度更可靠。

如在图6A中所示,整流部分614被包括在服务器612的出口处并且 在排气道616之前。在一个实例中,整流部分614被配置为在气流到达排 气测量部分618之前,缓和气流的速度和温度分布,并且在测量位置之前 或之后,重要的管道长度有助于在该区域内的气流达到平稳。要理解的是, 整流部分610可以是可选择的。

图6C示出了更详细的排气测量部分618。排气测量部分618也可以 包括热线风速仪或其他用于测量速度和温度的装置。在一些实例中,包括 用于测量服务器功率的测量系统和用于记录随着时间的推移而变化的温 度的数据获取系统。速度测量由入口测量部分610获取并且排气测量部分 618可以与如在图6A中所示的温度测量结合。可替代的是,速度测量可 以使用手持式热线风速仪或其它装置单独进行。

在各个实施方式中,仪器600可以用来确定入口温度和排气温度。在 至少一些实施方式中,测量服务器的理想化的热质量的重要的步骤是保证 排气温度被正确的加权,使得严格地实施稳定状态的能量平衡。换句话说, 测量的服务器上的稳定状态的温度差必须与以下方程一致:

          方程(25)

其中所有的参数(除了已知的空气的比热cp之外)由仪器600测量。 在稳定状态中使用“正确的”瞬态测试可以隔离方程(12) 中的瞬态项:

          方程(26)

此外,为了确保ΔT稳态正确,可以基于由入口测量部分610所测量的 更可靠的进气道速度的测量结果,来计算空气质量流速可以在排气处 对温度测量结果进行加权以说明每个测量位置的气流速率可以不是恒定 的事实。温度测量和速度测量的加权如下:

            方程(27)

其中计算的Vi是测量的速度并且均衡是用来根据经验校正测量误 差的附加加权参数。简单地选择均衡参数以调节方程(33)的右手边来 匹配方程(17)稳定状态

根据不同的实施方式,通过根据在图7中示出的方法700,使用装置 600,服务器质量的有效比热和时间常数τ1通过实验被首先测出。在 另一个实施方式中,在没有实验的情况下,可以通过称重服务器以 找出质量并执行逐个部件分析来确定比热而被确定。在这种情况中,只有 时间常数τ1将被操控以找出适合实验数据的模型。可以使用方法700来确 定外加热实例中的温度,例如,冷却电源故障的场景。在步骤702中,将 服务器612可以设置为以稳定的功率消散和稳定的气流速率运行。在一个 实例中,稳定的功率消耗和稳定的气流速率可以通过使用软件获得,该软 件将恒定的虚负载放置在服务器612的处理器上。由于许多服务器自动地 增加其气流速率以对过热的环境做出反应,这对于以恒定的气流速率启动 服务器是有益的。恒定的气流速率不仅仅更便于实验,而且其更适合于对 用于确定服务器的理想化的热质量很重要的数据中心电源故障的场景。要 理解的是,多数服务器中的最大的气流速率可以通过移除风扇转速仪的线 或通过对可感知覆盖物是否被移除的开关进行跳闸而被容易地识别。

在步骤704中,可以通过改变方程(27)中的均衡参数校准仪器600 直到满足了方程(38)的能量平衡。在步骤706中,从校准的稳定状态的 条件开始,入口的温度可以随着时间的推移周期(例如,几分钟)的推移 而变化。在一个实例中,入口温度可以被加热到随着时间的推移而变化。 在步骤708中,则分析数据并且确定时间常数τ1,该时间常数τ1给方程 (11-12)的分析模型提供最佳拟合。

在图8中示出的方法800可以被用于对内部加热场景中的服务器的反 应建模。特别是,通过使用第二组测量,方法800可以被用于确定热源相 对于服务器质量的有效位置λ。在步骤802中,服务器根据冷条件启动, 且尽可能快地将服务器的气流和功率提升到最大值。(这个功率和气流的 快速提升模拟服务器在启动、关闭和由于虚拟化的负载迁移期间的响应。) 在步骤804中,使用上面描述的方法700确定和τ1,找到提供方程 (11-12)与实验数据的分析模型的最佳拟合的λ的值。

要理解的是,如果使用仪器600和方法700和800表征大量的服务器, 可能更方便连续地测试许多给定大小(例如,1U、2U等等)的服务器, 使得可以进行最小的修改而重新使用仪器。不需要为每个服务器的大小制 作测量管道,因为喷嘴/扩散器适配器可以被用于1U管道到2U服务器, 或6U管道到5U服务器的过渡。使用这个方法,可能覆盖具有大概三个 实验配置的从1U到大约10U的服务器的整个实践范围。

使用测量仪器,如在图6A中所示的一个测量装置,表征多个条件下, 的许多服务器和/或每个服务器是相当简单的,如若干可选择的气流速率。 表征多个服务器可以允许服务器分布的虚拟库的创建,每个服务器的分布 包括多个性质。这样虚拟库可以便于瞬态事件(诸如,与电力故障相关的 冷却损耗(和返回)、或与IT负载改变相关的冷却损耗(和返回))的方 便建模,并且可以进一步优化冷却器和关于能量使用的其他基础设施的控 制系统。

实例服务器的理想化的热质量的表征

如实例,考虑戴尔R2001U 2-CPU服务器612。在该实例中,服务器 重9.0kg。基于可用的数据,有效热容量被估计为768J/(kg℃)。在稳定 条件下运行负载量设置为100%的处理器并且移除风扇转速计的线以产生 最大的气流,服务器散热99W并且移动在进气道608中测量的气流30.3 cfm。测验仪器600利用小型个人风格的1500W的加热器以产生升高的外 部温度。在这个实例中,三个热电偶被放置在进气道608处并且8个热电 偶被放置在排气道616处。在一个实例中,取代入口测量部分610和排气 测量部分614,使用手持式风速计提供速度测量。

图9可以说明通过参考方法700,在上面所描述的中心电力故障的场 景中产生的温度。为了提供稳定状态条件所需的能量平衡, 通过设置均衡参数可以校准数值模型。使用已校准的模型, 加热器以产生在图9中所示的入口温度分布的这样的方式打开。图9示出 了已测量的排气温度和入口温度以及模拟排气温度与时间的结果。τ1=400 秒的值提供模型与已测量的数据的最佳拟合。如果需要的话,根据这些值 可以计算其它参数:hA=17.25W/℃和ε=0.64。

图10示出了,如参考方法800所述,以确定服务器对自身加热的反 应为目标的功率和气流的快速上升。服务器可以从在没有环境热源的室温 处的完全关闭的状态下打开并且记录对其自身加热的反应。使用先前发现 的τ1的值,λ变化,直到分析模型匹配实验数据。图10示出了已测量的 排气温度曲线和由使用λ=0.10相对时间的理论模型所产生的曲线的拟 合。在示出的示例中小的λ值表明大多数服务器的有效热质量“落后于”热 源。在表1中总结了服务器的理想化的热质量特性。

戴尔R2002-CPU 1U服务器   气流速率(cfm) 30.3 M(kg) 9 Cp(J/(kg℃)) 768 ε 0.64 λ 0.1

表1-示例服务器的理想化的热质量的概述

在上述的实施方式中,提供了可以确定数据中心内的理想化的热质量 和有关温度的过程和系统。通过使用系统和方法的结果以改变设备的准确 布局或所建议的设备的布局,该系统和方法可以被用来提供数据中心的优 化设计。在上述描述的过程中,确定关于数据中心的冷却的值,包括气流 和温度。如本领域的一般技术人员容易理解的是,在至少一些实施方式中, 确定的值是对准确的值的预测,其将出现在具有模拟参数的数据中心内。 在至少一个实施方式的方法中,数据中心内的服务器和机架成功建模之 后,该模型的结果可以作为系统的一部分使用以订购设备、运送设备并且 按照设计的布局将设备安装到数据中心内。

因此已经描述了本发明的至少一个实施方式的若干方面,要理解的 是,对于本领域技术人员而言,将很容易出现各种改变、修改和改进。这 样的改变、修改和改进被认为是本公开的一部分,并且被认为是落入本发 明的精神和范围之内。因此前述描述和附图仅是通过示例的方式进行的。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号