首页> 中国专利> 适用于机房芯片级热管液冷的全机房统一监测平台及方法

适用于机房芯片级热管液冷的全机房统一监测平台及方法

摘要

本发明公开了适用于机房芯片级热管液冷的全机房统一监测平台及方法,包括:监测对象包括IT机柜服务器设备、精密空调设备、供配电设备、机房内的温湿度、机房和机柜漏液状况、液冷动力设备、液冷管路供回水数据;监测单元包括包括IT服务器群通讯模块、空调通讯模块、配电柜电量采集模块、室内温湿度传感器、漏水采集模块、电机变频器采集控制模块;信号转换单元分别与多个监测子模块连接;控制单元根据多个子监测模块的数据,输出报警信息,且根据液冷管路供回水数据,控制液冷动力设备的工作;显示单元。本发明通过对芯片级热管液冷架构下的机房的多个设备的统一监测,避免了多个监测系统的交互,提高了液冷机房的运行安全性。

著录项

说明书

技术领域

本发明属于机房监测技术领域,更具体地,涉及一种适用于机房芯片级热管液冷的全机房统一监测平台及方法。

背景技术

为了拥抱全球第四次工业革命浪潮的到来,2020年中国提出了支撑国民经济转型升级的新型基础设施建设(新基建)规划。新基建包含7项内容,其中至关重要的一项便是大数据中心建设,因为它是支撑5G网络、人工智能、大数据、云计算、智能驾驶等行业发展的基石。可以预测未来5-10年,全球各行各业的数据中心(机房)的建设和运营将进入蓬勃发展期,数字化、自动化和智能化将是全球经济发展的大势所趋。数据中心作为一种新型基础设施建设,属于重资产投资领域,其运行安全可靠性一方面关乎数据的安全可靠,另一方面决定了资产设备的运行周期寿命和投资回报。此外,数据中心的运行需要消耗大量的电力,数据中心的耗电已达到全球总耗电量的2%以上,其能耗监测和降低已成为国内外关注焦点之一。因此,机房的所有设备安全运行和电量消耗都需要通过一种有效的运维方法和平台实现24小时不间断的运行监测、显示和控制,以减少对运维工作人员的依赖,提高运维工作效率。

现有机房运维技术或系统平台一般都只能面向一种或一类对象进行监测,例如单面向机房环境监测(采用摄像、温湿度、安防传感器等)、单面向漏水监测、单面向暖通动力和供电设备监测、单面向IT设备的运行监视、单面向用能耗电量监测和展示等;个别已有发明的公开技术可能涉及到了上述某两类三类或四类对象的监测,但很少有涉及到对整个机房的全部对象实行统一监测,其难度体现在:一是对监测平台软件的二次开发提出了更高的要求,二是监测信号的传输协议和转换识别较为复杂。

此外,现有机房的制冷模式仍以风冷散热为主,但未来随着数据机房计算处理能力要求提升、机柜内服务器部署密度提升、芯片处理能力和功率不断提升三大背景下,采用液冷散热模式的机房将会快速增长和逐步成为发展主流。目前大多已有机房监测专利应用场景主要是面向风冷模式机房,而面向液冷模式机房的监测平台和方法较少。专利201610286818.3、201611244824.9、201710248845.6、201811559178.4公开了机房采用芯片级热管液冷架构的散热装置和系统,它相比传统风冷模式机房,是一个全新散热架构设计的机房,采用目前现有监测技术都不能满足其运行安全监测和绿色降耗需求,因此,特别需要一种适用于液冷散热模式的机房,且对整个机房的全部对象实行统一监测的系统及方法。

发明内容

本发明的目的是提出一种适用于液冷散热模式的机房,且对整个机房的全部对象实行统一监测的系统及方法。

为了实现上述目的,本发明提供了一种适用于机房芯片级热管液冷的全机房统一监测平台,包括:监测对象、监测单元、信号转换单元、控制单元、显示单元;所述监测对象包括IT机柜服务器设备、精密空调设备、供配电设备、视频安防设备、机房内的温湿度、芯片级热管运行状况、机房和机柜漏液状况、液冷动力设备、液冷管路供回水数据、室外大气环境参数、电力消耗数据、实时能耗PUE数据;所述监测单元包括多个子监测模块,包括IT服务器群通讯模块、空调通讯模块、配电柜电量采集模块、视频采集模块、烟感采集模块、火焰采集模块、室内温度传感器、室内湿度传感器、室外大气环境检测模块,漏水采集模块、UPS通讯模块、电机变频器采集控制模块、液冷管道温度传感器、流量传感器和电源开关模块,每个监测子模块分别与对应的监测对象连接;所述信号转换单元分别与多个监测子模块连接,所述信号转换单元包括多类通讯转换接口、串口设备;所述控制单元,所述控制单元与所述信号转换单元连接,用于根据所述IT机柜服务器设备的运行数据、所述精密空调设备的运行数据、所述机房内的温度和湿度、供配电设备的运行数据、电力消耗数据、漏液状况,输出报警信息,且根据所述液冷管路供回水数据,控制所述液冷动力设备的工作;所述显示单元,所述显示单元与所述控制单元连接,所述显示单元包括多类显示器、投屏器、手机app展示、云端交互展示、声光电报警器、SD/SIM卡短信发送器。

优选的,还包括冷却塔,所述冷却塔包括风机泵和喷淋泵,所述液冷管路包括循环泵,所述电机变频器采集控制模块安装在所述循环泵、风机泵和喷淋泵上;所述液冷管道温度传感器包括室内进回水温度传感器、室外进回水温度传感器和芯片级热管温度监测传感器。

优选的,数据传输方向包括采集数据方向和控制数据方向两种;所述采集数据方向是状态数据从监测对象向监测单元、信号转换单元和控制单元传输的方向,控制数据方向是控制数据从控制单元发出向转换单元、监测单元、监测对象和显示单元传输的方向。

优选的,每类监测对象的运行状态数据以数字信号或模拟信号的形式从采集数据方向传输到所述控制单元;所述控制单元发出的控制命令传输至所述信号转换单元,以供所述信号转换单元传输至对应的监测子模块,以控制对应的设备。

优选的,IT机柜服务器设备、液冷动力设备、控制单元、监测单元均采用UPS输出电源进行供电,大功率的冷水机组或者精密空调采用独立配电箱进行供电。

本发明还提供一种适用于机房芯片级热管液冷的全机房统一监测方法,包括:步骤1,控制单元发出指令后,接收监测单元获取的运行状态量和功能数据;步骤2,控制单元将获取的数据进行转换,并发送至显示单元;步骤3,所述控制单元根据预设数据,判断监测设备是否有报警信号;步骤4,所述控制单元根据大气环境温湿度和液冷管路回水温度,控制循环泵的流量和喷淋泵的开启。

优选的,所述运行状态量为被监测对象的状态逻辑值,包括开机与关机,管路高低压报警、管路高低压锁定、电压电流过载、电机过载、通讯故障、供电输入输出状态、告警状态;功能数据为监测对象的运行数据指标,包括温度、湿度、电压、电流、功率、频率、转速、扭矩、负载率等的瞬时数值。

优选的,所述步骤3包括:步骤301:判断监测对象是否有报警信号,当运行数据超出设定阀值范围或者运行状态量为报警值时,则表示存在报警信号;步骤302:控制单元根据预设的报警信号对获取的报警信号进行分类,识别报警等级,并发送命令和数据信息至显示单元,以供显示单元显示报警信号的类别、等级和故障位置,其中报警等级包括紧急、严重和一般;步骤303:当出现紧急报警时,控制单元向显示单元以短信形式和声光电形式报警,并发出控制命令从控制数据方向传送到电源开关模块,控制电源的断开。

优选的,所述液冷管路供回水数据包括:供水水温和回水水温,所述步骤4包括:步骤401,控制单元判断所述回水温度是否在设定区间内;步骤402,若所述回水温度在设定区间内,则维持液冷动力设备运行参数不变;步骤403,若所述回水温度不在设定区间内,当所述回水水温高于第二温度阈值时,所述控制单元控制所述循环泵以第一预设流量工作,控制所述风机以第一预设转速工作;当所述回水水温低于第三温度阈值时,所述控制单元控制所述风机停止工作;当所述回水水温低于第四温度阈值时,所述控制单元控制所述循环泵以第二预设流量工作,其中,所述第四温度阈值小于所述第三温度阈值;步骤404,当室外环境的温度高于第五温度阈值时,所述控制单元控制所述喷淋泵以第三预设流量工作;当所述室外环境的温度高于第六温度阈值且低于所述第五温度阈值时,所述控制单元控制所述喷淋泵以第四预设流量工作;当所述室外环境的温度低于或等于所述第六温度阈值时,所述控制单元控制所述喷淋泵停止工作。

优选的,所述控制单元计算实时能耗PUE数据,所述实时能耗PUE数据包括瞬态PUE值、日平均PUE值、月平均PUE值、年平均PUE值;

所述瞬态PUE值的计算方法如下:

瞬态PUE值=(IT全部设备瞬态功率+精密空调瞬态耗电功率+液冷动力设备瞬态功率+其他设备瞬态耗电功率)÷(IT全部设备瞬态功率)

所述日平均/月平均/年平均PUE值的计算方法如下:

读取软件数据库中保存的瞬态PUE值,按照日/月/年的时间跨度进行积分平均计算,计算公式如下:

所述日平均/月平均/年平均PUE值的另一种计算方法如下:以日/月/年为跨度读取存储的全部设备耗电的电度值,采用如下公式进行计算:

PUE日平均值=(IT全部设备日电度值+精密空调日电度值+液冷动力设备日电度值+其他设备的日电度值)÷(IT全部设备日电度值)

PUE月平均值=(IT全部设备月电度值+精密空调月电度值+液冷动力设备月电度值+其他设备的月电度值)÷(IT全部设备月电度值)

PUE年平均值=(IT全部设备年电度值+精密空调年电度值+液冷动力设备年电度值+其他设备的年电度值)÷(IT全部设备年电度值)。

本发明的有益效果在于:

1、本发明的适用于机房芯片级热管液冷的机房统一监测平台通过对芯片级热管液冷架构下的机房的多个设备的统一监测,实现了IT服务器系统、空调设备、供配电、机房环境、液冷系统、漏液系统、电力消耗等多功能的全覆盖和耦合集成,避免了多个监测系统的交互,提高了液冷机房的运行安全性和运维效率,为未来机房高度自动化和高度集成化控制带来了新的解决方案。

2、本发明首次公开了一种适用于芯片级液冷机房散热架构的监测平台,而现有监测平台一般针对风冷型机房,本发明填补了机房芯片级液冷架构的监测空白,尤其是采用热管芯片级液冷的监测方法和平台更是独一无二。

3、本发明公开的适用于芯片级液冷机房散热架构的监测平台和方法,能够根据外界环境温度变化和IT服务器负载情况变化导致的液冷回水温度变化而对多路水泵和风机的运行参数和耗电实行精准控制,在芯片级热管液冷充分利用自然冷和全年完全停用压缩机大幅度节能的基础上,进一步降低液冷动力系统的耗能。

4、本发明公开的监测平台实现了液冷动力系统、平台主机和所有采集模块等小功率低负荷启动设备挂载UPS的工程设计和实现,当出现市电断电或紧急断电时,IT设备芯片级液冷系统不会停止运行,监测平台全系统不会停止运行,IT设备产生热量的70%仍然可以通过液冷系统排放到外界环境,而传统精密空调制冷方式当出现紧急断电时,UPS只能短时间负载IT系统而制冷系统完全停止,相比之下本发明公开的监测平台和方法进一步提高了灾备可靠性,保证了IT系统运行散热的可持续性,延长了IT设备保存数据和安全停机时间。

5、本发明首次公开了适用于芯片级热管液冷机房的两种能耗PUE值计算方法,而现有公开技术较少地详细描述了机房PUE值的计算方法,本发明能够更好地规范地展示一个机房的实时PUE值、日平均PUE值、月平均PUE值、年平均PUE值。

6、本发明的一个重要技术进步是监测平台实现了IT系统和其他系统的联合监测、控制和耦合,这在整个行业内都是一个比较大的挑战,通过服务器IT系统的监测,能够在软件平台同步显示所有服务器CPU、内存、磁盘、风扇等的利用率、服务器关键电子器件的运行温度、电压、电流、功耗等运行参数,有利于调整其他动力环境系统的运行参数使之匹配服务器的安全可靠运行。

7、此外,本发明公开的统一监测方法还涉及到了整个机房的运营策略和全部系统的运维响应方法,提高了液冷机房的运行安全性和运维效率,这对于未来机房高度自动化和高度集成化控制带来了新的解决方案。

本发明的系统具有其它的特性和优点,这些特性和优点从并入本文中的附图和随后的具体实施例中将是显而易见的,或者将在并入本文中的附图和随后的具体实施例中进行详细陈述,这些附图和具体实施例共同用于解释本发明的特定原理。

附图说明

通过结合附图对本发明示例性实施方式进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显。其中,在本发明示例性实施方式中,相同的附图标记通常代表相同部件。

图1示出了根据本发明的一个实施例的适用于机房芯片级热管液冷的全机房统一监测平台的框图。

图2示出了根据本发明的一个实施例的适用于机房芯片级热管液冷的全机房统一监测方法的流程图。

图3示出了根据本发明的一个实施例的适用于机房芯片级热管液冷的全机房统一监测方法的详细流程图。

附图标记说明:

101、监测对象;201、监测单元;3、信号转换单元;4、控制单元;5、显示模块;401、采集数据方向;402、控制数据方向。

具体实施方式

下面将参照附图更详细地描述本发明的优选实施例。虽然附图中显示了本发明的优选实施例,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。

根据本发明的一种适用于机房芯片级热管液冷的全机房统一监测平台,包括:监测对象、监测单元、信号转换单元、控制单元、显示单元;监测对象包括IT机柜服务器设备、精密空调设备、供配电设备、视频安防设备、机房内的温湿度、芯片级热管运行状况、机房和机柜漏液状况、液冷动力设备、液冷管路供回水数据、室外大气环境参数、电力消耗数据、实时能耗PUE数据;监测单元包括多个子监测模块,包括IT服务器群通讯模块、空调通讯模块、配电柜电量采集模块、视频采集模块、烟感采集模块、火焰采集模块、室内温度传感器、室内湿度传感器、室外大气环境检测模块,漏水采集模块、UPS通讯模块、电机变频器采集控制模块、液冷管道温度传感器、流量传感器和电源开关模块,每个监测子模块分别与对应的监测对象连接;信号转换单元分别与多个监测子模块连接,信号转换单元包括多类通讯转换接口、串口设备;控制单元,控制单元与信号转换单元连接,用于根据IT机柜服务器设备的运行数据、精密空调设备的运行数据、机房内的温度和湿度、供配电设备的运行数据、电力消耗数据、漏液状况,输出报警信息,且根据液冷管路供回水数据,控制液冷动力设备的工作;显示单元,显示单元与控制单元连接,显示单元包括多类显示器、投屏器、手机app展示、云端交互展示、声光电报警器、SD/SIM卡短信发送器。

具体的,监测对象包括IT机柜服务器设备、精密空调设备、供配电设备、视频安防设备、房间温湿度数据、芯片级热管运行状况、房间和机柜漏液状况、液冷动力设备、液冷管路供回水数据、室外大气环境参数、电力消耗数据和实时能耗PUE数据。

对上述监测对象进行监测的监测单元包括多个子监测单元,例如监测IT机柜服务器设备的IT服务器群通讯模块,监测精密空调设备的空调通讯模块、监测供配电设备的配电柜电量采集模块、监测机房内温度和湿度的温湿度采集模块(包括温度传感器和湿度传感器)、监测机房安防的安防采集模块(包括视频采集模块、烟感采集模块和火焰采集模块)、监测机房和采集芯片级热管液冷循环管路的漏水情况的漏水采集模块、监测不间断(UPS)电源的UPS通讯模块、采集热管液冷动力设备的运行数据的电机变频器采集控制模块、采集芯片级热管液冷循环管路的供回水数据的液冷管道温度采集模块、液冷管道流量采集模块等。

信号转换单元包括各类通讯转换接口、串口设备等,信号传输和接收都满足各种标准化通讯协议,将上述各监测模块的数据传输给控制单元,并接收控制单元的信号,来自控制单元的信号传递至对应的监测模块。

控制单元即监测平台主机,可以为分布式处理服务器,也可以为集中式处理服务器,服务器上的监测软件接收采集数据后进行数据解析、数据计算、数据分析、数据存储、数据发布展示、发出告警命令、反馈控制命令等。

显示单元包括各类显示器、投屏器、手机app展示、云端交互展示、声光电报警器、SD/SIM卡短信发送器等。

监测平台主机发出指令实时采集多个监测单元的运行状态量和功能数据;平台主机将来自于信号转换单元的实时数据进行处理转换,发送至软件界面或显示模块显示;平台主机通过用户设定的设备参数正常工作范围或者设备自身报警状态信号有无来判断监测设备是否有报警信号;根据大气环境温湿度和液冷管路回水温度判断是否需要调节控制循环泵流量和喷淋泵开启,从而降低冷却系统能耗,获得机房低能耗PUE值。

根据示例性的实施方式,适用于机房芯片级热管液冷的机房统一监测系统通过对芯片级热管液冷架构下的机房的多个设备的统一监测,实现了IT服务器系统、空调设备、供配电、机房环境、液冷系统、漏液系统、电力消耗等多功能的全覆盖和耦合集成,填补了芯片级热管液冷架构下的机房的监测空白,避免了多个监测系统的交互,提高了液冷机房的运行安全性和运维效率,为未来机房高度自动化和高度集成化控制带来了新的解决方案。

作为优选方案,还包括冷却塔,冷却塔包括风机泵和喷淋泵,液冷管路包括循环泵,电机变频器采集控制模块安装在循环泵、风机泵和喷淋泵上;液冷管道温度传感器包括室内进回水温度传感器、室外进回水温度传感器和芯片级热管温度监测传感器。

具体的,电机变频器采集控制模块,安装在包括位于液冷管路上的循环泵、冷却塔的风机泵和喷淋泵上;液冷管道温度传感器包括室内进回水温度传感器、室外进回水温度传感器和芯片级热管温度监测传感器等。

作为优选方案,数据传输方向包括采集数据方向和控制数据方向两种;采集数据方向是状态数据从监测对象向监测单元、信号转换单元和控制单元传输的方向,控制数据方向是控制数据从控制单元发出向转换单元、监测单元、监测对象和显示单元传输的方向。

整个系统的数据传输方向包括采集数据方向和控制数据方向两种;采集数据方向是监测单元将监测对象的状态数据发送至信号转换单元,信号单元再将这些状态数据发送至控制单元;控制数据方向是控制单元发出的控制数据经过信号转换单元发送至监测单元或监测对象,以及控制单元将实时数据发送至显示模块。每一类监测对象的运行状态数据都能以数字或模拟信号的形式从采集数据方向汇入到控制单元;受监测对象和监测单元类型的限制,控制单元发出的控制命令不能传达到每一类监测对象,控制命令是用来实现一些设备的自动控制,例如电机变频器采集控制模块和其连接的各类动力设备。

作为优选方案,每类监测对象的运行状态数据以数字信号或模拟信号的形式从采集数据方向传输到控制单元;控制单元发出的控制命令传输至信号转换单元,以供信号转换单元传输至对应的监测子模块,以控制对应的设备。

具体的,每一类监测对象的运行状态数据都能以数字或模拟信号的形式从采集数据方向汇入到控制单元;受监测对象和监测单元类型的限制,控制单元发出的控制命令不能从控制数据方向传达到每一类监测对象,控制命令是用来实现一些设备的自动控制,例如电机变频器采集控制模块和其连接的各类动力设备。

作为优选方案,IT机柜服务器设备、液冷动力设备、控制单元、监测单元均采用UPS输出电源进行供电,大功率的冷水机组或者精密空调采用独立配电箱进行供电。

具体的,IT机柜服务器设备、液冷动力设备、控制单元、温湿度采集模块、配电柜电量采集模块、电机变频器采集控制模块、液冷管道温度采集模块、漏水采集模块、安防采集模块和信号转换单元都采用不间断(UPS)电源输出电源进行供电,而芯片级热管液冷循环管路中的大功率的冷水机组或者空调设备则设置独立配电箱进行供电。

监测平台实现了液冷动力系统、平台主机和所有采集模块等小功率低负荷启动设备挂载UPS电源的工程设计和实现,当出现市电断电或紧急断电时,IT设备芯片级液冷系统不会停止运行,监测平台全系统不会停止运行,IT设备产生热量的70%仍然可以通过液冷系统排放到外界环境,而传统精密空调制冷方式当出现紧急断电时,UPS电源只能短时间负载IT系统而制冷系统完全停止,相比之下本发明公开的监测平台和方法进一步提高了灾备可靠性,保证了IT系统运行散热的可持续性,延长了IT设备保存数据和安全停机时间。

根据本发明提供的一种适用于机房芯片级热管液冷的全机房统一监测方法,包括:步骤1,控制单元发出指令后,接收监测单元获取的运行状态量和功能数据;步骤2,控制单元将获取的数据进行转换,并发送至显示单元;步骤3,控制单元根据预设数据,判断监测设备是否有报警信号;步骤4,控制单元根据大气环境温湿度和液冷管路回水温度,控制循环泵的流量和喷淋泵的开启。

具体的,控制单元(监测平台主机)发出指令实时采集多个功能监测单元的运行状态量和功能数据;监测平台主机将实时数据转换和软件界面显示;监测平台主机通过用户设定的设备参数正常工作范围或者设备自身报警状态信号有无来判断监测设备是否有报警信号;监测平台主机根据大气环境温湿度和液冷管路回水温度判断是否需要调节控制循环泵流量和喷淋泵开启,从而降低冷却系统能耗,获得机房低能耗PUE值。

根据示例性的实施方式,

作为优选方案,运行状态量为被监测对象的状态逻辑值,包括开机与关机,管路高低压报警、管路高低压锁定、电压电流过载、电机过载、通讯故障、供电输入输出状态、告警状态;功能数据为监测对象的运行数据指标,包括温度、湿度、电压、电流、功率、频率、转速、扭矩、负载率等的瞬时数值。

具体的,运行状态量是指被监测对象的状态逻辑值,例如开机与关机,管路高低压报警、管路高低压锁定、电压电流过载、电机过载、通讯故障、供电输入输出状态、告警状态等,逻辑值一般为1或0;功能数据是指被监测对象的运行数据指标,例如温度、湿度、电压、电流、功率、频率、转速、扭矩、负载率等的瞬时数值。

实时数据转换是通过统一监测平台中的信号转换单元设备来实现的,将不同的满足标准通讯协议的信号或数据传输到平台主机的主板上;软件界面显示内容包括:IT机柜服务器自身状态、运行数据和负载情况、精密空调运行数据、供配电运行数据、视频安防数据、房间温湿度数据、热管系统运行数据、漏液预警数据、液冷动力设备运行数据、液冷供回水数据、大气参数实时数据、电力消耗数据、实时PUE数据等。其中IT机柜服务器运行数据包括服务器自身状态量、负荷情况如CPU、内存、磁盘、风扇等的利用率、运行指标如关键电子器件的运行温度、电压、电流、功耗等;供配电运行数据包括UPS主机运行参数和状态、电池运行参数和状态、配电柜开关状态等;热管系统运行数据包括芯片级热管的蒸发温度、冷凝温度等;液冷动力设备运行数据包括循环泵运行参数和状态、冷却塔喷淋泵和风机运行参数和状态、变频器运行参数和状态等;液冷供回水数据包括供水水温、回水水温、流量等,大气参数实时数据包括大气干球温度、大气湿度、大气湿球温度等;电力消耗数据包括全部IT设备、供配电设备、冷却系统设备以及所有辅件设备的消耗电量。

作为优选方案,步骤3包括:步骤301:判断监测对象是否有报警信号,当运行数据超出设定阀值范围或者运行状态量为报警值时,则表示存在报警信号;步骤302:控制单元根据预设的报警信号对获取的报警信号进行分类,识别报警等级,并发送命令和数据信息至显示单元,以供显示单元显示报警信号的类别、等级和故障位置,其中报警等级包括紧急、严重和一般;步骤303:当出现紧急报警时,控制单元向显示单元以短信形式和声光电形式报警,并发出控制命令从控制数据方向传送到电源开关模块,控制电源的断开。

具体的,在步骤3中,还包括如下步骤:第一步,判断被监测对象例如设备是否有报警信号,当设备的运行数据超出设定阀值范围或者运行状态量出现报警值时,则表示设备出现故障有报警信号;第二步,报警信号从采集数据方向汇入到控制单元,控制单元根据用户在数据库中预先设定的报警信号进行分类,自动区分告警等级,例如紧急、严重、一般三类;同时控制单元向显示单元发出命令和数据流,将报警信息分类、分等级、故障位置等在软件界面显示出来;第三步,当出现紧急报警时,例如烟感起火报警时,控制单元一方面向显示单元以短信发送形式告知运维人员和以声光电报警形式提醒机房附近人员,另一方面发出控制命令从控制数据方向传送到电源开关模块,自动断开关键设备的电源,避免事故进一步恶化和扩大;第四步,运维人员收到报警短信或报警信号后,依据故障类型和位置等信息到达现场迅速定位故障和排除故障,控制单元自动识别故障消除,恢复电源供电和故障信号复位消除。

作为优选方案,液冷管路供回水数据包括:供水水温和回水水温,步骤4包括:步骤401,控制单元判断回水温度是否在设定区间内;步骤402,若回水温度在设定区间内,则维持液冷动力设备运行参数不变;步骤403,若回水温度不在设定区间内,当回水水温高于第二温度阈值时,控制单元控制循环泵以第一预设流量工作,控制风机以第一预设转速工作;当回水水温低于第三温度阈值时,控制单元控制风机停止工作;当回水水温低于第四温度阈值时,控制单元控制循环泵以第二预设流量工作,其中,第四温度阈值小于第三温度阈值;步骤404,当室外环境的温度高于第五温度阈值时,控制单元控制喷淋泵以第三预设流量工作;当室外环境的温度高于第六温度阈值且低于第五温度阈值时,控制单元控制喷淋泵以第四预设流量工作;当室外环境的温度低于或等于第六温度阈值时,控制单元控制喷淋泵停止工作。

具体的,在步骤4中,还包括如下控制步骤和策略:第一步,控制单元识别获得液冷管路的供回水数据后,判断回水温度是否在设定区间内,例如40-45℃范围;第二步,若在设定区间内,则维持液冷动力设备运行参数不变;若不在设定区间内,则控制单元发出控制命令从控制数据方向402传送到多个电机变频器采集控制模块,实时改变液冷管路上的循环泵和冷却塔的风机泵的工作频率,从而改变泵的工作转速而调节芯片级液冷循环泵流量和冷却塔风机风量大小,例如当回水温度高于45℃时,循环泵流量和风机风量调节到最大,当回水温度低于40℃时,冷却塔风机停机,当回水温度低于35℃时,循环泵流量调节到最小;第三步,控制的单元在做出第一步逻辑判断同时,根据大气参数实时数据,自动判断是否停止冷却塔的喷淋泵或者调节喷淋泵流量,例如当室外大气干球温度高于37℃时,喷淋泵流量调节到最大,当大气干球温度低于37℃时而高于32℃时,喷淋泵流量逐步调小,当大气干球温度低于32℃时,控制单元发出控制命令从控制数据方向402传送到电源开关模块,控制喷淋泵开关由开启状态变为关闭状态。

其中,第一步第二步与第三步可以分别独立控制,也可以耦合在一起形成自动控制闭环回路,形成更为复杂更为精准的控制策略和方法。

根据外界环境温度变化和IT服务器负载情况变化导致的液冷回水温度变化而对多路水泵和风机的运行参数和耗电实行精准控制,在芯片级热管液冷充分利用自然冷和全年完全停用压缩机大幅度节能的基础上,进一步降低液冷动力系统的耗能。

电机控制变频器自动调节电机的频率和转速,可以采取分档分阶梯调节方法,也可以采取无级线性或无级曲率调节方法。

室外环境温度稍微有降低时,监测平台主机依据设定监测方法降低液冷系统循环水泵、冷却塔喷淋水泵和冷却塔风机的功率,从而降低三者的耗电量实现液冷回路节能最大化,降低整个冷却系统的用电量。

作为优选方案,控制单元计算实时能耗PUE数据,实时能耗PUE数据包括瞬态PUE值、日平均PUE值、月平均PUE值、年平均PUE值;

瞬态PUE值的计算方法如下:

瞬态PUE值=(IT全部设备瞬态功率+精密空调瞬态耗电功率+液冷动力设备瞬态功率+其他设备瞬态耗电功率)÷(IT全部设备瞬态功率)

日平均/月平均/年平均PUE值的计算方法如下:

读取软件数据库中保存的瞬态PUE值,按照日/月/年的时间跨度进行积分平均计算,计算公式如下:

日平均/月平均/年平均PUE值的另一种计算方法如下:以日/月/年为跨度读取存储的全部设备耗电的电度值,采用如下公式进行计算:

PUE日平均值=(IT全部设备日电度值+精密空调日电度值+液冷动力设备日电度值+其他设备的日电度值)÷(IT全部设备日电度值)

PUE月平均值=(IT全部设备月电度值+精密空调月电度值+液冷动力设备月电度值+其他设备的月电度值)÷(IT全部设备月电度值)

PUE年平均值=(IT全部设备年电度值+精密空调年电度值+液冷动力设备年电度值+其他设备的年电度值)÷(IT全部设备年电度值)。

具体的,实时PUE数据包括瞬态PUE值、日平均PUE值、月平均PUE值、年平均PUE值。其中瞬态PUE值的计算方法如下:

瞬态PUE值=(IT全部设备瞬态功率+精密空调瞬态耗电功率+液冷动力设备瞬态功率+照明等其他设备瞬态耗电功率)÷(IT全部设备瞬态功率)

其中日平均/月平均/年平均PUE值的计算方法有两种:第一种是读取软件数据库中保存的瞬态PUE值,按照日/月/年的时间跨度进行积分平均计算,计算公式如下:

第二种方法是以日/月/年为跨度读取软件数据库中保存的全部设备耗电的电度值,然后计算公式如下:

PUE日平均值=(IT全部设备日电度值+精密空调日电度值+液冷动力设备日电度值+照明等其他设备的日电度值)÷(IT全部设备日电度值)

PUE月平均值=(IT全部设备月电度值+精密空调月电度值+液冷动力设备月电度值+照明等其他设备的月电度值)÷(IT全部设备月电度值)

PUE年平均值=(IT全部设备年电度值+精密空调年电度值+液冷动力设备年电度值+照明等其他设备的年电度值)÷(IT全部设备年电度值)。

本发明首次公开了适用于芯片级热管液冷机房的两种能耗PUE值计算方法,而现有公开技术较少地详细描述了机房PUE值的计算方法,本发明能够更好地规范地展示一个机房的实时PUE值、日平均PUE值、月平均PUE值、年平均PUE值。

本发明的一个重要技术进步是监测平台实现了IT系统和其他系统的联合监测、控制和耦合,这在整个行业内都是一个比较大的挑战,通过服务器IT系统的监测,能够在软件平台同步显示所有服务器CPU、内存、磁盘、风扇等的利用率、服务器关键电子器件的运行温度、电压、电流、功耗等运行参数,有利于调整其他动力环境系统的运行参数使之匹配服务器的安全可靠运行。

实施例一

图1示出了根据本发明的一个实施例的适用于机房芯片级热管液冷的全机房统一监测平台的框图。

如图1所示,该适用于机房芯片级热管液冷的全机房统一监测平台,包括:监测对象101、监测单元201、信号转换单元3、控制单元4、显示单元5;监测对象101包括IT机柜服务器设备、精密空调设备、供配电设备、视频安防设备、机房内的温湿度、芯片级热管运行状况、机房和机柜漏液状况、液冷动力设备、液冷管路供回水数据、室外大气环境参数、电力消耗数据、实时能耗PUE数据;监测单元201包括多个子监测模块,包括IT服务器群通讯模块、空调通讯模块、配电柜电量采集模块、视频采集模块、烟感采集模块、火焰采集模块、室内温度传感器、室内湿度传感器、室外大气环境检测模块,漏水采集模块、UPS通讯模块、电机变频器采集控制模块、液冷管道温度传感器、流量传感器和电源开关模块,每个监测子模块分别与对应的监测对象连接;信号转换单元3分别与多个监测子模块连接,信号转换单元3包括多类通讯转换接口、串口设备;控制单元4,控制单元4与信号转换单元3连接,用于根据IT机柜服务器设备的运行数据、精密空调设备的运行数据、机房内的温度和湿度、供配电设备的运行数据、电力消耗数据、漏液状况,输出报警信息,且根据液冷管路供回水数据,控制液冷动力设备的工作;显示单元5,显示单元5与控制单元4连接,显示单元5包括多类显示器、投屏器、手机app展示、云端交互展示、声光电报警器、SD/SIM卡短信发送器。

其中,还包括冷却塔,冷却塔包括风机泵和喷淋泵,液冷管路包括循环泵,电机变频器采集控制模块安装在循环泵、风机泵和喷淋泵上;液冷管道温度传感器包括室内进回水温度传感器、室外进回水温度传感器和芯片级热管温度监测传感器。

其中,数据传输方向包括采集数据方向401和控制数据方向402两种;采集数据方向401是状态数据从监测对象向监测单元、信号转换单元和控制单元传输的方向,控制数据方向402是控制数据从控制单元发出向转换单元、监测单元、监测对象和显示单元传输的方向。

其中,每类监测对象101的运行状态数据以数字信号或模拟信号的形式从采集数据方向传输到控制单元4;控制单元4发出的控制命令传输至信号转换单元3,以供信号转换单元3传输至对应的监测子模块,以控制对应的设备。

其中,IT机柜服务器设备、液冷动力设备、控制单元、监测单元均采用UPS输出电源进行供电,大功率的冷水机组或者精密空调采用独立配电箱进行供电。

其中,当机房内的温度大于第一温度阈值时,控制单元4输出第一报警信息;当机房内的湿度大于湿度阈值时,控制单元4输出第二报警信息;当电力消耗数据大于电力消耗阈值时,控制单元4输出第三报警信息;当机房和机柜存在漏水情况时,控制单元4输出第四报警信息。

其中,IT机柜服务器设备的运行数据、精密空调设备的运行数据、供配电设备的运行数据和液冷动力设备的运行数据均包括运行状态量,控制单元4根据运行状态量,输出对应的报警信息,其中,运行状态量包括开机与关机、管路高低压报警、管路高低压锁定、电压过载、电流过载、电机过载、通讯故障、供电输入输出状态。

其中,系统还包括电源开关模块,当烟感信息为有烟产生时,控制单元4输出烟感报警信息并控制电源开关模块断开电源。

其中,液冷管路供回水数据包括:供水水温和回水水温,当回水水温高于第二温度阈值时,控制单元4控制循环泵以第一预设流量工作,控制风机以第一预设转速工作;当回水水温低于第三温度阈值时,控制单元4控制风机停止工作;当回水水温低于第四温度阈值时,控制单元4控制循环泵以第二预设流量工作,其中,第四温度阈值小于第三温度阈值。

其中,当室外环境的温度高于第五温度阈值时,控制单元4控制喷淋泵以第三预设流量工作;当室外环境的温度高于第六温度阈值且低于第五温度阈值时,控制单元4控制喷淋泵以第四预设流量工作;当室外环境的温度低于或等于第六温度阈值时,控制单元4控制喷淋泵停止工作。

实施例二

图2示出了根据本发明的一个实施例的适用于机房芯片级热管液冷的全机房统一监测方法的流程图。图3示出了根据本发明的一个实施例的适用于机房芯片级热管液冷的全机房统一监测方法的详细流程图。

结合图2和图3所示,该适用于机房芯片级热管液冷的全机房统一监测方法,包括:

步骤1,控制单元发出指令后,接收监测单元获取的运行状态量和功能数据;

步骤2,控制单元将获取的数据进行转换,并发送至显示单元;

步骤3,控制单元根据预设数据,判断监测设备是否有报警信号;

步骤4,控制单元根据大气环境温湿度和液冷管路回水温度,控制循环泵的流量和喷淋泵的开启。

其中,运行状态量为被监测对象的状态逻辑值,包括开机与关机,管路高低压报警、管路高低压锁定、电压电流过载、电机过载、通讯故障、供电输入输出状态、告警状态;功能数据为监测对象的运行数据指标,包括温度、湿度、电压、电流、功率、频率、转速、扭矩、负载率等的瞬时数值。

其中,步骤3包括:步骤301:判断监测对象是否有报警信号,当运行数据超出设定阀值范围或者运行状态量为报警值时,则表示存在报警信号;步骤302:控制单元根据预设的报警信号对获取的报警信号进行分类,识别报警等级,并发送命令和数据信息至显示单元,以供显示单元显示报警信号的类别、等级和故障位置,其中报警等级包括紧急、严重和一般;步骤303:当出现紧急报警时,控制单元向显示单元以短信形式和声光电形式报警,并发出控制命令从控制数据方向传送到电源开关模块,控制电源的断开。

其中,液冷管路供回水数据包括:供水水温和回水水温,步骤4包括:步骤401,控制单元判断回水温度是否在设定区间内;步骤402,若回水温度在设定区间内,则维持液冷动力设备运行参数不变;步骤403,若回水温度不在设定区间内,当回水水温高于第二温度阈值时,控制单元控制循环泵以第一预设流量工作,控制风机以第一预设转速工作;当回水水温低于第三温度阈值时,控制单元控制风机停止工作;当回水水温低于第四温度阈值时,控制单元控制循环泵以第二预设流量工作,其中,第四温度阈值小于第三温度阈值;步骤404,当室外环境的温度高于第五温度阈值时,控制单元控制喷淋泵以第三预设流量工作;当室外环境的温度高于第六温度阈值且低于第五温度阈值时,控制单元控制喷淋泵以第四预设流量工作;当室外环境的温度低于或等于第六温度阈值时,控制单元控制喷淋泵停止工作。

其中,控制单元计算实时能耗PUE数据,实时能耗PUE数据包括瞬态PUE值、日平均PUE值、月平均PUE值、年平均PUE值;

瞬态PUE值的计算方法如下:

瞬态PUE值=(IT全部设备瞬态功率+精密空调瞬态耗电功率+液冷动力设备瞬态功率+其他设备瞬态耗电功率)÷(IT全部设备瞬态功率)

日平均/月平均/年平均PUE值的计算方法如下:

读取软件数据库中保存的瞬态PUE值,按照日/月/年的时间跨度进行积分平均计算,计算公式如下:

日平均/月平均/年平均PUE值的另一种计算方法如下:以日/月/年为跨度读取存储的全部设备耗电的电度值,采用如下公式进行计算:

PUE日平均值=(IT全部设备日电度值+精密空调日电度值+液冷动力设备日电度值+其他设备的日电度值)÷(IT全部设备日电度值)

PUE月平均值=(IT全部设备月电度值+精密空调月电度值+液冷动力设备月电度值+其他设备的月电度值)÷(IT全部设备月电度值)

PUE年平均值=(IT全部设备年电度值+精密空调年电度值+液冷动力设备年电度值+其他设备的年电度值)÷(IT全部设备年电度值)。

以上已经描述了本发明的实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的实施例。在不偏离所说明的实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号