首页> 中国专利> 基于人工智能的机房温度预测方法及系统

基于人工智能的机房温度预测方法及系统

摘要

本发明公开了基于人工智能的机房温度预测方法,包括步骤通过温度传感器获得目标区域的温度数据,获取服务器信息,对温度进行预处理,建立LSTM网络,获得预测温度,根据预测温度发出预警和调节冷却系统。本发明实现了利用人工智能技术,根据历史信息预测服务器的运行状态和冷却系统的工作状态,自动联动调节冷却系统和发出预警,避免了因为超温造成服务器服务中断。

著录项

  • 公开/公告号CN113849052A

    专利类型发明专利

  • 公开/公告日2021-12-28

    原文格式PDF

  • 申请/专利权人 广州云硕科技发展有限公司;

    申请/专利号CN202110962304.6

  • 发明设计人 唐佳;

    申请日2021-08-20

  • 分类号G06F1/20(20060101);G06F11/30(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构44493 广州专理知识产权代理事务所(普通合伙);

  • 代理人张凤

  • 地址 510000 广东省广州市南沙区南江三路8、10号(自编二栋)201房

  • 入库时间 2023-06-19 13:26:15

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-11-04

    授权

    发明专利权授予

说明书

技术领域

本发明涉及温度预测技术领域,具体涉及基于人工智能的机房温度预测方法及系统。

背景技术

计算机技术(Computer Technology)内容非常广泛,可粗略分为计算机系统技术、计算机器件技术、计算机部件技术和计算机组装技术等几个方面。计算机技术包括:运算方法的基本原理与运算器设计、指令系统、中央处理器(CPU)设计、流水线原理及其在CPU设计中的应用、存储体系、总线与输入输出。

AI(Artificial Intelligence人工智能)是研究使计算机来模拟人生的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术,也有软件层面的技术。人工智能技术一般包括计算机视觉技术、语音识别技术、自然语言处理技术以及及其学习/深度学习、大数据处理技术、知识图谱技术等几大方面。

ML(Machine Learning机器学习)是一门多领域交叉学科,涉及概率论、统计学、逼近论、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

DL(Deep Learning深度学习)是ML机器学习(Machine Learning,机器学习)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能。深度学习是学习样本数据的内在律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。

LSTM是一种用于解决梯度消亡现象的改进型RNN,广泛用于自然语言处理、图片标注、机器翻译等领域,通过引入3个sigmoid神经网络和按位乘法操作的门结构,LSTM可以选择性地改变神经网络中的状态,其中“遗忘门”可以根据当前输入,上一个状态和上一个输出决定哪部分信息需要被放弃,“输出门”可以根据当前输入,上一个状态和上一个输出决定哪部分信息进入当前状态,输出门根据当前状态,当前输入,上一个输出决定当前的输出。

随着信息化社会范围的逐步扩大,计算机行业的能源问题逐渐突显,根据工信部5月公布的《全国数据中心应用发展指引(2018)》数据显示,截至2017年底,我国在用数据中心的机柜总规模为166万个,同比增长33.4%,其中大型、超大型数据中心的规模增速达到68%。

超大型数据中心机房的温度调控是个热门话题,如何高效地预测机房温度和调控冷却系统成为当前的迫切课题。

发明内容

本发明的目的在于提出基于人工智能的机房温度预测方法,以解决现有技术中所存在的一个或多个技术问题,至少提供一种有益的选择或创造条件。

为实现上述技术目的,本发明技术方案如下:

基于人工智能的机房温度预测方法,所述方法包括以下步骤:

步骤1,通过温度传感器获得目标区域的温度数据,获取服务器信息;

步骤2,对温度进行预处理;

步骤3,建立LSTM网络,获得预测温度;

步骤4,根据预测温度发出预警和调节冷却系统。

进一步地,步骤1中,通过温度传感器获得目标区域的温度数据,获取服务器信息的子步骤为:

所述目标区域包括多个机柜的进风口,多个机柜出风口,机房冷却系统的多个送风端和冷却系统的多个回风端;

在上述区域分别设置温度传感器,所有传感器通过无线与接收模块连接,连接技术可以是以下的一种或多种技术:NB-IoT,LTE-M,Weightless,HaLow,LoRa, Sigfox,RPMA,Neul,BLE;

所述服务器信息包括CPU使用率,硬盘活动时间占比,网络使用率。

进一步地,步骤2中,对温度进行预处理的子步骤为:

步骤2.1,对温度数据和服务器信息进行预处理,剔除干扰数据,对温度传感器的数据和服务器信息进行归一化处理;

步骤2.2,设定采样间隔为t1,有M个温度传感器,当前时刻为T,对于过去的时刻T

所述张量集合TRT中的元素由来自温度传感器的温度和服务器信息包括CPU使用率,硬盘活动时间占比,网络使用率4个要素组成,张量集合TRT是上述信息的时间序列数据;

步骤2.3,划分温度数据为训练样本和测试样本,其中训练样本和测试样本的比例为8:2。

进一步地,步骤3中,建立LSTM网络,获得预测温度的子步骤为:

步骤3.1,建立LSTM网络,把训练样本输入LSTM网络;

所述LSTM网络使用2层LSTM,每层128个节点,LSTM的Dropout的值为0.20;步骤3.2,改变参数,利用均方根误差(Root Mean Square Error,RMSE)、平均绝对误差(MeanAbsolute Error,MAE)和平均绝对百分比错误(Mean Absolute Percentage Error,MAPE)作为评价判断评估训练模型的性能,RMSE和MAE用于评估绝对误差,MAPE用于评估相对误差,当训练模型的误差达到设定的阈值时,停止训练;

步骤3.3,利用步骤3.2获得的模型获得预测温度。

优选地,步骤3还可以为温度数据进行处理获得散热系统的运行状态,子步骤为:步骤3.1,划分子区域,计算每个子区域的第二指数I1d和所述第一指数I1u: I1u={1-[Σ(Rin-R↑)/((THRS↑-R↑)×Rn)]}×100%,

式中,I1u为第一指数,Rin为机柜进风口的温度,R↑为机柜进风温度第一参数,THRS↑为机柜进风温度警戒值的上限,Rn为机架的数量,(Rin-R↑)为子区域内所有机柜进风口的温度与机柜进风温度第一阈值的差值,Σ(Rin-R↑)为对上述所有差值进行求和;

I1d={1-[Σ(R↓-Rin)/((R↓-THRS↓)×Rn)]}×100%,

式中,I1d为第二指数,Rin为机柜进风口的温度,R↓为机柜进风温度第二参数,THRS↓为机柜进风温度警戒值的下限,Rn为机架的数量,(R↓-Rin)为机柜进风温度第二参数与子区域内所有机柜进风口的温度的差值,Σ(R↓-Rin)为对上述所有差值进行求和;

步骤3.2,计算冷却系统效率指数ACE:

ACE=[(ACh-ACs)/(R'out-R'in)]-1,式中,ACE为冷却系统效率指数,ACh为冷却系统的回风温度,ACs为冷却系统的送风温度,R'out为当前冷却系统管理区域内所有机柜的排风温度的平均值, R'in为当前冷却系统管理区域内所有机柜的进风温度的平均值;

步骤3.3,判断冷却系统是否工作在理想范围。

进一步地,步骤3.3中,判断冷却系统是否工作在理想范围的子步骤为:

步骤3.3.1,判断冷却系统效率指数ACE是否在理想范围,所述理想范围为[-0.1,0.1],如果冷却系统效率指数ACE大于理想范围的上限,则判断:

所有子区域里,统计第二指数I1d大于第一指数I1u且差值大于20%的子区域数量超过阈值δ,则标记冷却系统当前的通风能力不够;

所有子区域里,统计第二指数I1d大于第一指数I1u且差值大于20%的子区域数量没有超过阈值δ,则标记冷却系统当前的冷却能力不够;

如果冷却系统效率指数ACE小于理想范围的下限,则判断:

所有子区域里,统计第二指数I1d小于第一指数I1u且差值大于20%的子区域数量超过阈值δ,则标记冷却系统当前的通风能力盈余;

所有子区域里,统计第二指数I1d小于第一指数I1u且差值大于20%的子区域数量没有超过阈值δ,则标记冷却系统当前的冷却能力盈余。

进一步地,步骤4中,根据预测温度发出预警和调节冷却系统的子步骤为:

步骤4.1,以间隔T1执行步骤3.3获得的预测温度判断机房的状态,如果在一个预先设定的区域里有机柜的进风和排风的温度差超过所有区域的平均值,跳转步骤4.2,如果在一个设定的区域里有机柜的进风和排风的温度差低于第一阈值,跳转步骤4.3;

步骤4.2,判断当前区域的送风端和回风端的温差是否大于冷却系统的容忍值,如果小于容忍值则调节冷却系统,包括加大制冷量和送风风速,如果当前区域的送风端和回风端的温差大于冷却系统的容忍值,则发出超温预警,跳转步骤4.1;步骤4.3,计算当前区域里所有机柜的进风和排风的温度差,计算所述温度差的方差,如果小于第二阈值则调节冷却系统,包括降低制冷量和送风风速,跳转步骤4.1。

优选地,调节冷却系统的方法还可以是:

根据优选的步骤3,获得冷却系统的运行状态调节散热系统和发出警报,子步骤为:

步骤4.1,如果冷却系统没有工作在理想范围,则根据步骤3.3.1的判断结果调整,如果冷却系统的通风能力不够,则增大冷却系统的风力;如果冷却系统的冷却能力不够,则增大冷却系统的制冷能力;如果冷却系统的通风能力盈余,则减少冷却系统的风力;如果冷却系统的冷却能力盈余,则减少冷却系统的制冷能力;步骤4.2,按照设定的时间间隔执行步骤3.1到步骤3.3和步骤4.1,如果在重复执行设定的次数后,在风力或者制冷能力到达极限后如果冷却系统效率指数 ACE仍然没有达到理想范围则发出警报。

基于人工智能的机房温度预测系统,所述系统包括:

传感器管理模块:用于接收温度传感器的数据,并发送至数据处理模块;

数据处理模块:用于对数据进行预处理,并发送至数据预测模块;

数据预测模块:用于对输入数据进行训练,得到训练模型,根据训练模型计算预测温度;

服务器管理终端:用于获取服务器信息,传输至数据处理模块;

冷却系统控制模块:根据数据预测模块的预测温度调节冷却系统;

预警模块:根据预测温度发出预警。

与现有技术相比,本发明具有以下有益的技术效果:

利用人工智能技术,根据历史信息预测服务器的运行状态和冷却系统的工作状态,自动联动调节冷却系统和发出预警,避免了因为超温造成服务器服务中断。

附图说明

为了使本领域的技术人员更好地理解本发明的技术方案,下面通过对结合附图所示出的实施方式进行详细说明,本发明的上述以及其他特征将更加明显,本发明附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:

图1为本发明提供的基于人工智能的机房温度预测方法的流程图;

图2为本发明一个实施例的基于人工智能的机房温度预测系统结构示意框图;

具体实施方式

为了使本发明的目的、技术方案及优点更加清晰,以下结合附图及实施例,对本发明进行进一步详尽说明。此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

同样应理解,以下实施例只用于对本发明进行进一步说明,不能理解为对本发明保护范围的限制,本领域的技术人员根据本发明上述内容做出的一些非本质的改进和调整均属于本发明的保护范围。下述示例具体的工艺参数等也仅是合适范围内的一个示例,即本领域技术人员可以通过本文的说明做合适的范围内选择,而并非要限定于下文示例的具体数值。

以下示例性地说明本发明提供的基于人工智能的机房温度预测方法。

如图1所示为基于人工智能的机房温度预测方法的流程图,下面结合图1来阐述根据本发明的实施方式的基于人工智能的机房温度预测方法,所述方法包括以下步骤:

步骤1,通过温度传感器获得目标区域的温度数据,获取服务器信息;

步骤2,对温度进行预处理;

步骤3,建立LSTM网络,获得预测温度;

步骤4,根据预测温度发出预警和调节冷却系统。

进一步地,步骤1中,通过温度传感器获得目标区域的温度数据,获取服务器信息的子步骤为:

所述目标区域包括多个机柜的进风口,多个机柜出风口,机房冷却系统的多个送风端和冷却系统的多个回风端;其中,冷却系统为中央空调或者制冷机之类的制冷设备。

在上述区域分别设置温度传感器,所有传感器通过无线与接收模块连接,连接技术可以是以下的一种或多种技术:NB-IoT,LTE-M,Weightless,HaLow,LoRa, Sigfox,RPMA,Neul,BLE;

所述服务器信息包括CPU使用率、硬盘活动时间占比、网络使用率中任意一种或者多种。

进一步地,步骤2中,对温度进行预处理的子步骤为:

步骤2.1,对温度数据和服务器信息进行预处理,对温度传感器的数据和服务器信息进行归一化处理;

步骤2.2,设定采样间隔为t1,有M个温度传感器,当前时刻为T,对于过去的任一时刻T

所述张量集合TRT中的元素由来自温度传感器的温度和服务器信息包括CPU使用率,硬盘活动时间占比,网络使用率4个要素组成,张量集合TRT是上述信息的时间序列数据;

步骤2.3,划分温度数据为训练样本和测试样本,其中训练样本和测试样本的比例为8:2。

进一步地,步骤3中,建立LSTM网络,获得预测温度的子步骤为:

步骤3.1,建立LSTM网络,把训练样本输入LSTM网络;

所述LSTM网络使用2层LSTM,每层128个节点,LSTM的Dropout的值为0.20;步骤3.2,改变参数,利用均方根误差(Root Mean Square Error,RMSE)、平均绝对误差(MeanAbsolute Error,MAE)和平均绝对百分比错误(Mean Absolute Percentage Error,MAPE)作为评价判断评估训练模型的性能,RMSE和MAE用于评估绝对误差,MAPE用于评估相对误差,当训练模型的误差达到阈值时,停止训练;

步骤3.3,利用步骤3.2获得的模型获得预测温度。

优选地,步骤3还可以为温度数据进行处理获得散热系统的运行状态,子步骤为:步骤3.1,划分子区域,计算每个子区域的第二指数I1d和所述第一指数I1u: I1u={1-[Σ(Rin-R↑)/((THRS↑-R↑)×Rn)]}×100%,

式中,I1u为第一指数,Rin为机柜进风口的温度,R↑为机柜进风温度第一参数,THRS↑为机柜进风温度警戒值的上限,(Rin-R↑)为子区域内机柜进风口的温度与机柜进风温度第一阈值的差值,Rn为机架的数量,Σ(Rin-R↑)为对上述所有差值进行求和;

I1d={1-[Σ(R↓-Rin)/((R↓-THRS↓)×Rn)]}×100%,

式中,I1d为第二指数,Rin为机柜进风口的温度,R↓为机柜进风温度第二参数,THRS↓为机柜进风温度警戒值的下限,Rn为机架的数量,(R↓-Rin)为机柜进风温度第二参数与子区域内机柜进风口的温度的差值,Σ(R↓-Rin)为对上述所有差值进行求和;

步骤3.2,计算冷却系统效率指数ACE:

ACE=[(ACh-ACs)/(R'out-R'in)]-1,式中,ACE为冷却系统效率指数,ACh为冷却系统的回风温度,ACs为冷却系统的送风温度,R'out为当前冷却系统管理区域内所有机柜的排风温度的平均值, R'in为当前冷却系统管理区域内所有机柜的进风温度的平均值;

步骤3.3,判断冷却系统是否工作在理想范围。

进一步地,步骤3.3中,判断冷却系统是否工作在理想范围的子步骤为:

步骤3.3.1,判断冷却系统效率指数ACE是否在理想范围,所述理想范围为[-0.1,0.1],如果冷却系统效率指数ACE大于理想范围的上限,则判断:

所有子区域里,统计第二指数I1d大于第一指数I1u且差值大于20%的子区域数量超过阈值δ,则标记冷却系统当前的通风能力不够;

所有子区域里,统计第二指数I1d大于第一指数I1u且差值大于20%的子区域数量没有超过阈值δ,则标记冷却系统当前的冷却能力不够;

如果冷却系统效率指数ACE小于理想范围的下限,则判断:

所有子区域里,统计第二指数I1d小于第一指数I1u且差值大于20%的子区域数量超过阈值δ,则标记冷却系统当前的通风能力盈余;

所有子区域里,统计第二指数I1d小于第一指数I1u且差值大于20%的子区域数量没有超过阈值δ,则标记冷却系统当前的冷却能力盈余。

所述超过指>,没有超过指≤。

在一个实施例里,阈值δ取值为3,其中,冷却系统为中央空调或者制冷机之类的制冷设备。

进一步地,步骤4中,根据预测温度发出预警和调节冷却系统的子步骤为:

步骤4.1,以间隔T1执行步骤3.3获得的预测温度判断机房的状态,如果在一个预先设定的区域里有机柜的进风和排风的温度差超过所有区域的平均值,跳转步骤4.2,如果在一个设定的区域里有机柜的进风和排风的温度差低于第一阈值,跳转步骤4.3;

步骤4.2,判断当前区域的送风端和回风端的温差是否大于冷却系统的容忍值,如果小于容忍值则调节冷却系统,包括加大制冷量和送风风速,如果当前区域的送风端和回风端的温差大于冷却系统的容忍值,则发出超温预警,跳转步骤4.1;步骤4.3,计算当前区域里所有机柜的进风和排风的温度差,计算所述温度差的方差,如果小于第二阈值则调节冷却系统,包括降低制冷量和送风风速,跳转步骤4.1。

优选地,调节冷却系统的方法还可以是:

根据优选的步骤3,获得冷却系统的运行状态调节散热系统和发出警报,子步骤为:

步骤4.1,如果冷却系统没有工作在理想范围,则根据步骤3.3.1的判断结果调整,如果冷却系统的通风能力不够,则增大冷却系统的风力;如果冷却系统的冷却能力不够,则增大冷却系统的制冷能力;如果冷却系统的通风能力盈余,则减少冷却系统的风力;如果冷却系统的冷却能力盈余,则减少冷却系统的制冷能力;步骤4.2,按照设定的时间间隔执行步骤3.1到步骤3.3和步骤4.1,如果在重复执行设定的次数后,在风力或者制冷能力到达极限后如果冷却系统效率指数 ACE仍然没有达到理想范围则发出警报。

基于人工智能的机房温度预测系统,所述系统包括:

如图2所示是本发明一个实施例的基于人工智能的机房温度预测系统结构示意框图;

传感器管理模块:用于接收温度传感器的数据,并发送至数据处理模块;

数据处理模块:用于对数据进行预处理,并发送至数据预测模块;

数据预测模块:用于对输入数据进行训练,得到训练模型,根据训练模型计算预测温度;

服务器管理终端:用于获取服务器信息,传输至数据处理模块;

冷却系统控制模块:根据数据预测模块的预测温度调节冷却系统;

预警模块:根据预测温度发出预警。

所述基于人工智能的机房温度预测系统可以运行于桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备中。所述基于人工智能的机房温度预测系统,可运行的系统可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述例子仅仅是基于人工智能的机房温度预测系统的示例,并不构成对基于人工智能的机房温度预测系统的限定,可以包括比例子更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述基于人工智能的机房温度预测系统还可以包括输入输出设备、网络接入设备、总线等。

所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列 (Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述基于人工智能的机房温度预测系统运行系统的控制中心,利用各种接口和线路连接整个基于人工智能的机房温度预测系统可运行系统的各个部分。

所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述基于人工智能的机房温度预测系统的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD) 卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

尽管本发明的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,从而有效地涵盖本发明的预定范围。此外,上文以发明人可预见的实施例对本发明进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本发明的非实质性改动仍可代表本发明的等效改动。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号