首页> 中国专利> 一种用于集群计算环境的细粒度状态信息同步采集系统

一种用于集群计算环境的细粒度状态信息同步采集系统

摘要

本发明公开了一种用于集群计算环境的细粒度状态信息同步采集系统,涉及服务器使用技术领域。该系统包括:信息分析服务器和n个计算机主机,每个所述计算机主机上安装BMC芯片和信息采集子系统;信息采集子系统安装到计算机主机的操作系统中,BMC芯片独立与计算机主机的操作系统集成在计算机主机的主板上,BMC芯片和信息采集子系统分别与信息分析服务器数据连通;BMC芯片、信息采集子系统与计算机主机一一对应设置;信息采集子系统包括:信息接收存储模块、处理模块、传递模块和信息展示模块。本发明智能的采集、控制和自动回报大量服务器的运作状况,降低服务器系统运维成本,且可带外管理,实现了在非正常状况下远端管理系统。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-08-17

    授权

    授权

  • 2016-01-20

    实质审查的生效 IPC(主分类):H04L12/26 申请日:20150813

    实质审查的生效

  • 2015-12-23

    公开

    公开

说明书

技术领域

本发明涉及服务器使用技术领域,尤其涉及一种用于集群计算环境的细粒 度状态信息同步采集系统。

背景技术

在网络与信息安全专用计算环境中,多采用通用架构X86服务器系统,但 随着云计算、大数据和系统节能降耗等要求的不断提升,通用服务器的运行状 态及能耗信息的采集变得更加重要。这些需求更加依赖精准的数据采集和分析。 而通过现有服务器硬件和普通操作系统的,无法满足下述需求:无法保证在不 干扰目标系统正常使用的前提下大量采集数据;集群节点同步时间只能依赖软 件方式实现,且采集精准度较低;采集信息不能覆盖所有关键重要部件。

发明内容

本发明的目的在于提供一种用于集群计算环境的细粒度状态信息同步采集 系统,从而解决现有技术中存在的前述问题。

为了实现上述目的,本发明所述用于集群计算环境的细粒度状态信息同步 采集系统,该系统包括:信息分析服务器和n个计算机主机,所述n≥1,每个所 述计算机主机上安装BMC芯片和信息采集子系统;

所述信息采集子系统安装到所述计算机主机的操作系统中,所述BMC芯片 独立与所述计算机主机的操作系统集成在所述计算机主机的主板上,所述BMC 芯片和所述信息采集子系统分别与所述信息分析服务器数据连通;所述BMC芯 片、所述信息采集子系统与所述计算机主机一一对应设置;

所述信息采集子系统包括:信息接收存储模块、处理模块、传递模块和信 息展示模块,其中,

所述信息接收存储模块,用于接收并存储操作系统的应用信息;

所述处理模块,将接收到的消息按照消息类别或类型进行分类,并标记超 过预先设定阈值的信息,然后将分类并标记的消息发送到传递模块;

所述传递模块,将接收应用消息发送到信息分析服务器;

信息分析服务器,根据消息的类别或类型将从传递模块中接收到的应用消 息添加到预先设定的单元中存储。

优选地,所述BMC芯片可脱离于计算机主机的操作系统进行带外管理。

优选地,所述计算机主机的系统中安装APP应用软件;所述计算机主机的 系统通过APP应用软件访问所述信息分析服务器;

所述信息分析服务器包括:

注册模块,用于接收并保存用户通过所述APP应用软件输入的注册信息; 所述注册信息为用户基本信息,包括用户ID;

登录模块,用于实现用户登录所述信息分析服务器;

绑定模块,用于接收并保存所述用户ID绑定的至少一个被BMC芯片采集 硬件应用信息的计算机主机的系统IP;

第一查询模块,用于当用户通过所述登录模块登录到所述信息分析服务器 后,所述信息分析服务器通过查找所述绑定模块,获得与登录用户绑定的所有 计算机主机的系统IP,并将查询到的所有计算机主机的系统IP推送到所述APP 应用软件的显示界面;

第二查询模块,用于当所述APP应用软件的显示界面所显示的某个所述计 算机主机系统的IP被点击后,所述信息分析服务器即接收到对所述计算机主机 系统IP的信息进行实时查询的请求消息;

日志模块:所述信息分析服务器根据所述请求消息,在所述日志模块中查 询所述请求消息相关联的信息,然后,所述信息分析服务器将查询得到所述计 算机主机系统IP的信息发送到所述APP软件的显示界面展示。

更优选地,所述日志模块,用于存储所有与所述信息分析服务器数据连接 的信息采集子系统和BMC芯片传递的信息,包括通过计算机主机系统IP相互 关联的系统应用信息单元、性能信息单元、温度单元和能耗查看单元,其中,

所述系统应用信息单元,用于存储计算机主机系统IP及所述计算机主机系 统IP的系统信息;

所述性能信息单元,用于存储所述计算机主机中硬件的性能状态信息;

所述温度信息,用于存储所述计算机主机中硬件的温度信息;

所述能耗查看单元,用于存储所述计算机主机中硬件的能耗和状态信息。

优选地,所述信息分析服务器还包括用户管理模块,所述用户管理模块中 对存储的用户的浏览权限和管理权限进行限定。

优选地,所述信息采集子系统安装在所述计算机主机的可插拔存储介质中。

优选地,所述BMC芯片按照下述方法将采集到的信息传递给所述信息分析 服务器:

S1,所述BMC芯片与所述计算机主机的内设形成硬件架构,所述硬件架构 与所述BMC芯片中的NTP服务集成硬件架构NTP服务;

S2,所述BMC芯片通过所述硬件架构NTP服务获取每个所述计算机主机 内设的信息;

S3,将采集到的信息及采集的信息的计算机主机的系统IP发送到所述信息 分析服务器;

其中,所述BMC芯片进行每一次采集信息的时间戳与NTP时间进行对时。

更优选地,步骤S2中,所述BMC芯片通过内设部件上的传感器收集每个 内设部件的温度数据、能耗数据、运行状态数据。

优选地,所述信息分析服务器接收到所述BMC芯片和所述信息采集子系统 传递过来的数据后,按照下述方法进行处理:

A1,所述信息分析服务器将从BMC芯片中接收到的第一数据组存储在相 应的计算机主机系统IP单元中;

A2,判断接收到的数据是否超出预先设定的相应数据的阈值,如果超出, 则标记后进入A3,如果没有超出,则直接进入S3;

A3,将从BMC芯片中接收到的第一数据组和从所述信息采集子系统接收 到的第二数据组,按照数据的类别形成表单后,分别存储到所述信息分析服务 器日志模块中,

所述数据类别包括:系统概述、性能信息、温度信息和能耗。

更优选地,性能信息、温度信息和能耗还以实时曲线图的方式展现。

本发明的有益效果是:

使用本发明所述系统,可以横跨不同的操作系统、固件和平台,可以智能 的采集、控制和自动回报大量服务器的运作状况,以降低服务器系统运维成本, 并采用定义单独硬件架构定义子系统进行通信的方法,保证集群中的服务器时 间的统一性和准确性。并且允许进行带外管理,操作系统不必负担传输系统状 态数据的任务,采集结果可以通过图形方式直观有效的显示输出。

本发明能够解决在不干扰目标系统的正常使用的前提下大量采集数据,采 集信息覆盖所有关键重要部件,并且采用独立的硬件芯片精准同步集群各节点 的时间;能够独立于操作系统外自行运作,并容许管理者即使在缺少操作系统 或系统管理软件、或受查看的系统关机但有接电源的情况下仍能远端管理系统, 也能在操作系统启动后活动;能够通过简单的WEB界面直观,有效的管理及按 需分配集群内各节点的采集信息。

附图说明

图1是计算机主机内部结构示意图;

其中,1-1可插拔存储介质;1-2风扇组;1-3内存;1-4cpu;1-5BMC芯片; 1-6电源;1-7机箱;1-8主板;

图2是所述信息分析服务器的结构示意图;

图3是所述信息分析服务器页面结构示意图;

其中,3-1系统概述;3-2性能信息;3-3温度信息;3-4能耗查看。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以 解释本发明,并不用于限定本发明。

实施例

本实施例所述用于集群计算环境的细粒度状态信息同步采集系统,该系统 包括:信息分析服务器和n个计算机主机,所述n≥1,每个所述计算机主机上安 装BMC芯片和信息采集子系统;所述信息采集子系统安装到所述计算机主机的 操作系统中,所述BMC芯片独立与所述计算机主机的操作系统集成在所述计算 机主机的主板上,所述BMC芯片和所述信息采集子系统分别与所述信息分析服 务器数据连通;所述BMC芯片、所述信息采集子系统与所述计算机主机一一对 应设置;信息分析服务器,根据消息的类别或类型将从传递模块中接收到的应 用消息添加到预先设定的单元中存储。下面对各结构进行详细说明:

(一)、信息采集子系统

信息采集子系统包括:信息接收存储模块、处理模块、传递模块和信息展 示模块,其中,

1、信息接收存储模块,用于接收并存储操作系统的应用信息;

2、处理模块,将接收到的消息按照消息类别或类型进行分类,并标记超过 预先设定阈值的信息,然后将分类并标记的消息发送到传递模块;

3、传递模块,将接收应用消息发送到信息分析服务器;

(二)计算机主机和信息分析服务器

所述计算机主机的系统中安装APP应用软件;所述计算机主机的系统通过 APP应用软件访问所述信息分析服务器;

1、所述计算机主机包括:安装在机箱内的风扇组、可插拔存储介质和主板, 安装在主板上的电源、内存、CPU和BMC芯片,所述可插拔存储介质和BMC 芯片分别集成在所述主板上,且所述BMC芯片独立与所述计算机主机的操作系 统集成在所述主板上,可脱离于计算机主机的操作系统进行带外管理,所述信 息采集子系统安装在所述计算机主机的可插拔存储介质中。

2、信息分析服务器包括:

(1)注册模块,用于接收并保存用户通过所述APP应用软件输入的注册信 息;所述注册信息为用户基本信息,包括用户ID;

(2)登录模块,用于实现用户登录所述信息分析服务器;

(3)绑定模块,用于接收并保存所述用户ID绑定的至少一个被BMC芯片 采集硬件应用信息的计算机主机的系统IP;

(4)第一查询模块,用于当用户通过所述登录模块登录到所述信息分析服 务器后,所述信息分析服务器通过查找所述绑定模块,获得与登录用户绑定的 所有计算机主机的系统IP,并将查询到的所有计算机主机的系统IP推送到所述 APP应用软件的显示界面;

(5)第二查询模块,用于当所述APP应用软件的显示界面所显示的某个所 述计算机主机系统的IP被点击后,所述信息分析服务器即接收到对所述计算机 主机系统IP的信息进行实时查询的请求消息;

(6)日志模块:所述信息分析服务器根据所述请求消息,在所述日志模块 中查询所述请求消息相关联的信息,然后,所述信息分析服务器将查询得到所 述计算机主机系统IP的信息发送到所述APP软件的显示界面展示;所述日志模 块,用于存储所有与所述信息分析服务器数据连接的信息采集子系统和BMC芯 片传递的信息,包括通过计算机主机系统IP相互关联的系统应用信息单元、性 能信息单元、温度单元和能耗查看单元,其中,

(6.1)系统应用信息单元,用于存储计算机主机系统IP及所述计算机主机 系统IP的系统信息;

(6.2)性能信息单元,用于存储所述计算机主机中硬件的性能状态信息;

(6.3)温度信息,用于存储所述计算机主机中硬件的温度信息;

(6.4)能耗查看单元,用于存储所述计算机主机中硬件的能耗和状态信息。

(7)用户管理模块,所述用户管理模块中对存储的用户的浏览权限和管理 权限进行限定。

本发明中所述信息分析服务器精细化用户管理和主机管理,对于不同角色 登陆系统,根据其权限,可对用户的信息进行管理。并且可根据地点、机房、 节点等元素,对各种服务器资源进行高效组织划分,为用户提供了从资源精细 化切分、管控到采集、故障解决一整套解决方案。例如管理员可以对用户信息 实现,查询、删除,审核等操作。可对单台及集群服务器进行添加/删除/修改等 操作,可通过日志管理收集观察整体硬件资源运行健康状态信息,显著增强服 务器数据安全性,可运维性,易管理性。

本发明中,所述BMC芯片按照下述方法将采集到的信息传递给所述信息分 析服务器:

S1,所述BMC芯片与所述计算机主机的内设形成硬件架构,所述硬件架构 与所述BMC芯片中的NTP服务集成硬件架构NTP服务;

S2,所述BMC芯片通过所述硬件架构NTP服务获取每个所述计算机主机 内设的信息;所述BMC芯片通过内设部件上的传感器收集每个内设部件的温度 数据、能耗数据、运行状态数据,所述内设部件包括:cpu、内存、芯片组、风 扇、电源。

S3,将采集到的信息及采集的信息的计算机主机的系统IP发送到所述信息 分析服务器,其中,所述BMC芯片进行每一次采集信息的时间戳与NTP时间 进行对时,以保证采集的准确性和高效性。

本发明通过对独立的BMC芯片采集硬件信息的结构优化和设计,使用独立 于操作系统外的BMC芯片通过各关键部件cpu、内存、芯片组、风扇、电源上 的传感器收集温度信息、能耗、运行状态等数据,并且由于采用了独立的BMC 芯片的硬件设计不依赖于操作系统,所以并不额外增加操作系统的负载,有效 提升系统的利用率,并且当操作系统出现故障或异常时也不影响采集的收集。 即BMC芯片可以实现在不影响操作系统独立运行的外部信息采集,并实现对服 务器的多项性能进行采,实现性能的细粒度。所述本发明所述系统提供一个可 选的基于浏览器的WEB界面以方便系统管理人员查看网络状态,各种系统问 题,以及日志等等。

通过集成的带内系统管理命令采集cpu、内存、磁盘、网络、进程的实时负 载。管理员可通过便捷的WEB页面观察节点内各服务器的运行情况,根据运行 结果分析可以快速定位系统问题范围、性能瓶颈点,从而实现高效管理集群内 各节点服务器的温度信息,能耗状态,并能够根据采集的信息按需分配,有效 的控制和利用能耗及资源。

本发明中,若操作系统正常运行,信息采集子系统和BMC芯片实时同步采 集所需信息。服务器管理人员可通过远程图形界面观察并收集所需信息,通过 采集的信息,有效管理,并且能够通过所需调整集群中各个节点的功能,达到 每节点的高利用率。所述信息分析服务器接收到所述BMC芯片和所述信息采集 子系统传递过来的数据后,按照下述方法进行处理:

A1,所述信息分析服务器将从BMC芯片中接收到的第一数据组存储在相 应的计算机主机系统IP单元中;

A2,判断接收到的数据是否超出预先设定的相应数据的阈值,如果超出, 则标记后进入A3,如果没有超出,则直接进入S3;

A3,将从BMC芯片中接收到的第一数据组和从所述信息采集子系统接收 到的第二数据组,按照数据的类别形成表单后,分别存储到所述信息分析服务 器日志模块中,所述数据类别包括:系统概述、性能信息、温度信息和能耗。 其中,性能信息、温度信息和能耗还以实时曲线图的方式展现。

当服务器运行时,专用信息采集子系统能够通过BMC芯片集成的硬件架构 ntp服务实现采集的统一性和准确性,而不依赖于传统方式软件搭建的ntp服务, 该架构能使其服务器时钟源进行时间同步,它可以提供高精准度的时间校正, 而且可以使用加密确认的方式来防止恶意的协议攻击。使用专用采集软件提供 的硬件ntp服务,可保障高密度、高频率下各节点采集的一致性。从而实现采集 的高精度、细粒度。所述信息采集子系统能够抓取服务器整体功耗及明细、单 独部件功耗及明细,能够实时查看系统进程数明细、关键件占用率、端口信息 等。

通过采用本发明公开的上述技术方案,得到了如下有益的效果:使用本发 明所述系统,可以横跨不同的操作系统、固件和平台,可以智能的采集、控制 和自动回报大量服务器的运作状况,以降低服务器系统运维成本,并采用定义 单独硬件架构定义子系统进行通信的方法,保证集群中的服务器时间的统一性 和准确性。并且允许进行带外管理,操作系统不必负担传输系统状态数据的任 务,采集结果可以通过图形方式直观有效的显示输出。

本发明能够解决在不干扰目标系统的正常使用的前提下大量采集数据,采 集信息覆盖所有关键重要部件,并且采用独立的硬件芯片精准同步集群各节点 的时间;能够独立于操作系统外自行运作,并容许管理者即使在缺少操作系统 或系统管理软件、或受查看的系统关机但有接电源的情况下仍能远端管理系统, 也能在操作系统启动后活动;能够通过简单的WEB界面直观,有效的管理及按 需分配集群内各节点的采集信息。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通 技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰, 这些改进和润饰也应视本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号