首页> 中国专利> 包含可管理性子系统以实时监视和管理数据中心资源的系统和方法

包含可管理性子系统以实时监视和管理数据中心资源的系统和方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种用于使用与数据中心基础设施管理(DCIM)系统相关联的远程访问装置形成分布式数据存储的方法。可以生成与由DCIM系统监视的被管理设备的操作相关联的数据。可以使用至少一个远程访问装置来接收数据。可以由远程访问装置使用元素库框架来根据数据生成事件。远程访问装置还可以用于实现复杂事件处理子系统以分析事件并且根据事件生成事件相关信号。可以使用总线将事件相关信号从该装置发送至DCIM系统的公共平台服务(CPS)子系统。CPS子系统还可以用于接收事件相关信号并且使用事件相关信号来通知用户被管理设备的性能方面。

著录项

公开/公告号CN103999077A

专利类型发明专利
公开/公告日2014-08-20

原文格式PDF
申请/专利权人阿沃森特亨茨维尔公司;
展开▼

申请/专利号CN201280061412.5
发明设计人巴拉特·A·胡季;萨沙·约维契奇;史蒂文·格芬;
展开▼

申请日2012-12-12
分类号G06F17/00(20060101);G06F15/16(20060101);
代理机构11227 北京集佳知识产权代理有限公司;
代理人陈炜;李德山
地址美国阿拉巴马州
入库时间 2023-12-17 01:34:31

法律信息

法律状态公告日

法律状态信息

法律状态
2019-05-03

专利权的转移 IPC(主分类):G06F17/00 登记生效日:20190412 变更前: 变更后: 申请日:20121212

专利申请权、专利权的转移
2019-05-03

专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F17/00 变更前: 变更后: 申请日:20121212

专利权人的姓名或者名称、地址的变更
2016-12-21

授权

授权
2016-12-14

著录事项变更 IPC(主分类):G06F17/00 变更前: 变更后: 申请日:20121212

著录事项变更
2014-09-17

实质审查的生效 IPC(主分类):G06F17/00 申请日:20121212

实质审查的生效
2014-08-20

公开

公开

查看全部

说明书

相关申请的交叉引用

本申请要求于2011年12月12日提交的美国临时申请No.61/569,583 的优先权，其全部内容通过引用合并到本申请中。

技术领域

本申请针对用于管理与数据中心相关联的基础设施的系统和方法，具体地针对用于以如下方式监视和管理现代数据中心的硬件组件和软件组件的系统和方法：优化硬件组件和软件组件的有效使用，并且还使得数据中心的基础设施组件的实时重新配置能够满足不断变化的需求和要求。

背景技术

该部分提供了与本公开内容有关的、不一定是现有技术的背景信息。

通用数据中心模型自其源于大型机计算以来已经经历了多种改变。从分布式计算机到客户端/服务器模型、虚拟服务器的利用、网格整合、以及最近朝向公共事业(utility)或“云”计算的趋势，对数据中心的要求一直在变化和发展，并且其进展的步伐也持续增加。

现代数据中心正在经历一场广泛的改革，其包括技术创新、操作改进、新的设计原理、数据中心供应链的改变以及IT与业务之间的关系的改变。因而，现代数据中心正形成具有很多变量的日益复杂的环境，当考虑优化数据中心的效率的方法时必须顾及这些变量。伴随这种改革带来了能量效率和资源管理的问题，这对于这些现代数据中心的成功和长期维持而言将会至关重要。最大化效率的能力取决于能够从与数据中心(即，IT和基础设施)相关联的所有不同组件采集数据，并且能够以有用的方式将信息呈现给能够在必要时对其做出改变的系统管理员。尤其，随着可以部署在数据中心环境中的各种类型(例如，气流、电压、温度、湿度)的传感器的日益增长的能力，以及从这样的传感器的输出获得数千个实时数据点的能力，用于分析和总结大量获得的数据点的需求日益重要。然而，挑战是如何以显著减少需要被提供给用户的信息量的方式来采集和分析从数据中心中所使用的各种广泛类型的传感器获得的大量数据点。简单地将从传感器获得的每个数据点通过网络提供给用户或用户所使用的应用程序将快速使用网络的可利用的带宽的大部分。在每秒从数百或更多传感器获得数千数据点的大型现代数据中心中尤其是这样。

发明内容

在一个方面，本公开内容涉及一种用于使用与数据中心基础设施管理 (DCIM)系统相关联的远程访问装置形成分布式数据存储库的方法。该方法可以包括生成与由DCIM系统监视的被管理设备的操作相关联的数据。可以使用至少一个远程访问装置来接收数据并且使用元素库框架来根据数据生成事件。远程访问装置可以使用复杂事件处理子系统以分析事件并且根据事件生成事件相关信号。可以使用总线以将事件相关信号从该装置发送至DCIM系统的公共平台服务(CPS)子系统。该CPS子系统可以用于接收事件相关信号并且使用事件相关信号以通知用户被管理设备的性能方面。

在另一方面，本公开内容涉及一种用于传输与由数据中心基础设施管理(DCIM)系统监视的被管理设备相关联的事件的方法。该方法可以包括使用服务总线代理子系统通过超文本传输协议(HTTP)传输来从与 DCIM系统相关联的远程访问装置接收不同通道上的高优先级事件和非高优先级事件。通道中的一个通道可以被指派为高优先级事件通道，并且通道中的另一通道可以被指派为非高优先级事件通道。事件传输网络可以用于形成两个分开的消息队列，所述消息队列用于接收来自两个通道中每个的事件并且将高优先级事件和非高优先级事件发送至分开的存储子系统。事件传输服务还可以同时向事件查看器和警报处理中至少之一发布高优先级事件和非高优先级事件中至少之一。

另外的应用领域将根据本文提供的描述而变得明显。本发明内容中的描述和具体示例仅意在用于说明的目的，而不意在限制本公开内容的范围。

附图说明

本文中所描述的附图仅出于对所选实施方式而并非所有可能实施方式的说明目的，也不意在限制本公开内容的范围。

图1示出了根据本公开内容的合并了数据集市的DCIM系统；

图2示出了示出如何实现数据集市的另外的细节的DCIM系统的另一实施方式；

图3是示出了在数据集市ETL服务的操作的提取、变换和加载阶段期间可以执行的各种操作的框图；

图4示出了示出结合图1的数据集市如何实现不同的聚合和数据保留对策/策略的金字塔；

图5示出了示出DCIM系统的每个DCIM装置如何包括各种组件使得装置组可以集体地用于形成“分布式”事件存储的本公开内容的DCIM 系统的另一实施方式；

图6示出了可以由DCIM系统使用的DCIM装置的另一实施方式，其中DCIM装置具有分布式体系结构用于获得、记录和检索数据点，并且还合并具有不同的优先级等级的用于数据点的数据点路由的两个通道；

图7示出了本公开内容的DCIM装置的另一实施方式，该DCIM装置利用如果违背阈值则生成事件的阈值监视服务以及包括存储从某个标准或百分比改变预定值变化的所生成的事件的值变化(COV)事件数据存储的PostgreSQL数据库服务器；

图8示出了根据本公开内容的DCIM解决方案的实施方式，在该实施方式中不同的通信路径和两个队列用于独立地且同时地处理高优先级事件和非高优先级事件以确保来自所有DCIM装置的事件的点对点保证传输；以及

图9示出了根据本公开内容的DCIM系统的另一实施方式，在该实施方式中高优先级事件在事件传输网络内被删除，并且均被存留到用于事件存储的数据库，并且也根据对事件查看器的发布/预定策略以保证方式被传输。

贯穿附图的几幅图，相应的附图标记表示相应的部分。

具体实施方式

下面的描述在本质上仅是示例性的，并不意在限制本公开内容、应用或用途。应当理解，贯穿所有附图，相应的附图标记表示相似或相应的部分和特征。

图1示出了根据本公开内容的具有集成的数据集市子系统1000的 DCIM系统100的一个示例。数据集市子系统1000用于提供对所记录的数据的增强访问、数据的增强报告以及对从数据中心内的被管理设备获得的数据的增强的分析能力。

图1中示出的DCIM系统100仅表示一种可能的构造，并且将理解的是，可以相当大地改变DCIM系统100的组件以适合不同的具体应用。 DCIM系统100可以包括具有浏览器202的第一(客户端)表示层200。第一表示层200还可以包括一个或更多个插件，如Adobe Flex插件204。第二(服务器)表示层300可以包括管理控制台302、一个或更多个应用程序用户接口(APP UI)304和306、公共平台服务(CPS)用户接口308、可管理性子系统服务用户接口(MSS UI)310、以及用于向用户呈现信息的一个或更多个仪表板312。

公共平台服务(CPS)层400形成共享服务基础设施子系统，该共享服务基础设施子系统提供可以由任何产品使用的分开的或组合服务，例如诸如认证、授权和审核的服务。在该示例中，CPS层400被示为具有集成子系统402和多个共享服务404、406和408。CPS层400还可以包括实时数据服务子系统410(例如，业务活动监视(“BAM”)子系统)、CPS 报告引擎412和在线分析处理(“OLAP”)引擎414。共享服务408形成可管理性子系统服务(“MSS服务”)，这是通过分布式实时框架提供被管理设备的管理(例如，发现、数据采集、命令和控制)的合成服务。

DCIM系统100还可以包括数据层500，数据层500具有域模型502 和公共数据模型存储库(“CDMR”)504。CDMR504可以具有用于将数据保留到DCIM数据库服务器508的保留子系统506。数据集市子系统 1000可以形成数据层500和服务层400两者的一部分。数据集市子系统 1000可以具有数据集市提取-变换-加载(“ETL”)子系统1002和数据集市服务器1004。数据集市子系统1000可以与DCIM数据库服务器508、与时间序列数据库(TSD)服务器510以及与服务层400的一个或更多个组件通信。MSS服务408与分布层600的一个或更多个远程访问装置602 交互。每个远程访问装置(在下文中，简称“装置”)602内可以包括MSS 引擎604。每个MSS引擎604可以是在可被部署在每个装置602上以获取度量数据和对由每个装置602处理的被管理设备执行管理(例如，发现、数据采集、命令和控制)的适当的处理器上运行的软件组件。每个MSS 引擎604可以将采集的数据馈送至MSS服务408以及馈送至TSD服务器 510和CDMR504。然而，将理解的是，一个或更多个智能采集引擎(例如，MSS引擎604)还可以被实现为在服务器中或在虚拟机上运行的软件应用程序。

数据集市ETL服务1002提供用于从DCIM系统100内的其他数据资源以及从TSD服务器510和DCIM数据库服务器508提取数据的能力。数据集市ETL服务1002可以将所提取的数据变换成期望的格式，然后可以将该数据加载到数据集市数据库服务器1004中。可以周期性地执行提取、变换和加载功能，以保持数据集市子系统1000充分地填充有用于报告和分析的数据。除了填充数据集市数据库服务器1004以外，数据集市 ETL服务1002还可以向事件传输网络发布关于由诸如适当的服务器(例如，由操作为实时数据服务子系统410的Oracle“业务活动监视”(“BAM”) 服务器)的组件消费的关键值或信息的事件。

在操作中，数据集市ETL服务1002从TSD服务器510和DCIM数据库服务器508提取适当的数据，然后对该数据进行变换并且将该数据加载到数据集市数据库服务器1004中。该活动可以通过由人工ETL请求或由用户可定制调度任务生成的具体事件驱动。当建立了用户可定制调度任务时，数据集市ETL服务1002利用用户通过管理控制台302设置的配置。用户可定制调度任务的预选择的配置限制从TSD服务器510和DCIM数据库服务器508提取的数据集，然后将该数据集加载到数据集市数据库服务器1004中。

数据集市子系统1000还可以向CPS层400发布事件。数据集市ETL 服务1002可以生成表示成功完成了数据提取将其加载到数据集市数据库服务器1004的事件。支持TSD510的适当的软件服务可以清理和/或清除已成功加载到数据集市数据库服务器1004中的数据。该活动可以由如下事件驱动：该事件在成功完成了提取和加载时由数据集市ETL服务1002 生成。CPS报告引擎412和OLAP引擎414与数据集市数据库服务器1004 和DCIM系统100的其他数据存储库(如TSD服务器510)交互，以检索正在创建的报告所需的数据。在大多数情况下，为报告提供的数据将需要限制于基于授权和租用的适当的聚合。由CDMR504提供类似的数据强制。仪表板312的“静态查看”组件312a与CPS报告引擎412和OLAP 引擎414交互，以检索要呈现在适当的显示器上供用户查看的历史信息。数据集市子系统1000可以提供大量非常有用的特征。一个非常有用的特征是将数据集市数据库服务器1004中的数据备份和恢复的能力。其他有用的特征为：将数据集市数据库服务器1004中的数据的所选择的聚合存档和清除的能力；将先前存档和清除的数据恢复返回到数据集市数据库服务器1004中的能力；将从数据集市数据库服务器1004检索的数据限制于基于用户授权和租用的适当数据集的能力；支持不需要与阈值(在下面的段落中进一步讨论)比较的数据点的聚合的能力；支持以不同的方式(每小时、每日、平均、最小、最大等)总结/积累数据点的能力；以及被部署在分离的服务器上以隔离来自其他操作活动的报告的能力。

现在参照图2，高层次图1100示出了可以被合并到DCIM系统100 中的数据集市子系统的另一实现。图1100还示出了关于如何提供数据集市子系统的提取、变换和加载(ETL)体系结构的更多细节。在该示例中，上述各种数据库以简化方式被表示为一个数据库1102。可以使用ETL子系统1104从数据库1102提取数据以及从数据集市1106获得维度查找表 (即，数据组织指导)，在该示例中，ETL子系统1104可以包括例如从 Jaspersoft公司可得到的Jaspersoft业务智能软件。数据集市1106可以存储已经聚合了年、季度、月、周、日或根据任何其他用户定义的维度或指导聚合的聚合数据。数据集市1106还可以存储事件的细节、数据点的细节以及装备面板基本信息。更进一步，数据集市1106可以存储但不限于与设备、时间、事件或数据点有关的信息。

可以包括待命区1108，待命区1108是在需要对所提取的信息执行篡改或修改时可以临时保存所提取的信息的区域。在该示例中为Jasper Oracle批量加载模块的报告工具1110可以用于将所提取的数据呈现给数据集市1106或数据集市1106中与各种被管理设备的事件细节、数据点细节和装备面板值有关的查找信息。

如框112所示，还可以获得缓慢变化的维度(即，数据采集和/或总结的方式)。框1112可以表示用于分析变化并确定是否出现非常缓慢的变化的软件，其可以应用于从ETL子系统1104提取的数据。如框1114表示的，维度可以被加载，然后可以根据所加载的维度将所提取的数据聚合在数据集市1106中。

参照图3，框1116总结可以对从TSD服务器510(图1)、从CDMR 504或从所提取的事件获得的所提取的数据执行的各种软件操作。框1118 示出了可以应用于所提取的数据具体变换和加载操作。框1118a处的操作 “应用键/代理键生成”涉及应用和生成代理键。框1118b涉及所提取的数据的数据再分配。框1118c涉及根据预定维度对数据进行标准化的数据标准。框1118d涉及进行参考完整性检查。并且，框1118e“保持SCD” 涉及保持说明书的服务组件描述。图4示出了关于所提取的数据可以用于聚合和报告的广泛方式(即，维度)的示例。

对所提取的数据进行聚合的显著优点在于，这可以提供通过网络发送所获得的数据所需要的带宽的显著降低，从而显著地减轻网络的负担。在很多情况下，可能无需将每个单个采集的数据点提供至正在监视数据中心中的各种基础设施组件(例如，计算机控制的空调(CARC)单元)或IT (信息技术)组件的一个或更多个应用。通常，不同预定时间间隔的一个或更多个运行平均可能足以向数据中心操作者提供关于各种数据中心组件的操作状态或数据中心环境本身(例如，温度和能耗)的所需信息。用于执行聚合的原始数据点可以在被新获取的数据点覆写之前累积或保持一定时间段。通过根据用户定义的聚合策略提供聚合的数据，这可以用于动态地减少需要通过网络发送的数据量。此外，这可以在至少预定时间内仍然存储每个采集的数据点时实现，使得当数据中心操作者请求时在至少有限的时间内可利用给定时间帧的所有采集的数据点。该特征在如下情况下很有用：在该情况下，数据中心管理者需要详细学习在具体时间处在数据中心中发生的事件，并且围绕关注的具体时间帧采集的所有数据点的可利用性对于该事件的分析很重要。

分布式事件和数据点存储库

参照图5，高层级图示出了DCIM系统100的每个远程访问装置1300 可以如何包括各种组件，以使得远程访问装置1300组可以共同地用于形成“分布式”事件存储库。在该实施方式中，远程访问装置1300与总线 1302通信，在该示例中，总线1302可以是Oracle服务总线(“OSB”)。 OSB1302进行操作以将事件路由至DCIM解决方案100的公共平台服务 (CPS)层1304(其中，可选地，层1304还可以包括图1的CPS400的各种组件)。在图5中，标记“A”的箭头表示事件流，标记“B”的箭头表示队列，而标记“C”的箭头表示命令流。远程访问装置1300用于监视一个或更多个被管理设备或与被管理设备相关联的一个或更多个传感器。应当注意的是，如果在远程访问装置1300和CPS层1304之间失去通信，则直到与CPS层1304恢复通信时为止事件和数据可以存储在远程访问装置中的适当数据库中。

远程访问装置1300(下文为“装置1300”)可以包括元素库框架1306。元素库框架1306可以用于执行若干功能，如采集数据点和事件；基于预定策略对所接收的事件标准化；以及发送所采集的事件、数据点和SNMP (简单网络管理协议)陷阱。事件采集器1308可以用于订阅SNMP陷阱以使用“进栈(push)”和轮循模式两者采集设备事件、在数据总线1310 上发送事件采集信号，以及对事件标准化。由机器可执行代码形成的且在远程访问装置1300的处理器上运行的事件输出服务1311可以用于接收事件采集信号。事件输出服务1311可以用于更新策略(例如，添加或修改过滤器)，以应用该策略接收事件信号(例如，以便排除不满足阈值严重性的事件类型或事件)，并且形成至少两个通道1302a和1302b用于输出事件。可以指派通道之一(如通道1302a)用于高优先级事件，而可以指派另一通道1302b用于所有其他事件，即，没有被认为是高优先级事件的那些事件。

装置1300还可以包括事件存储服务1312。事件存储服务1312可以是具有合适的软件和硬件的数据库，该数据库接收表示所采集的事件的信号、更新策略(例如，保留策略)以及查询事件数据(例如，事件类型、严重性和数据范围)。事件存储服务1312还可以将原始事件异步地写入数据库1314，在该示例中，数据库1314可以是PostgreSQL(开放源码) 数据库服务器。

装置1300还可以包括用于复杂事件处理(CEP)的子系统1316，其接收数据点、事件相关信号并且分析事件和发出事件生成信号。装置1300 可以包含服务管理控制器1318，服务管理控制器1318可以用于启动、停止、暂停、重新开始和更新在数据总线1310上操作的所有服务的策略。另一服务(如MBeans服务1320)可以用于实现对服务管理控制器1318 的远程访问。

装置1300还可以包括网页(Web)服务器1322，网页服务器1322 将RESTful服务调用路由至事件查询服务1324。网页服务器1322还可以处理安全性功能，如认证和加密套接字协议层(SSL)传输以及DOS(拒绝服务)攻击。网页服务器1322还可以包含审核日志。

OSB1302可以包含至少一个高优先级事件队列1302a1以及至少一个低优先级事件队列1302b1。当OSB1302接收从装置1300推出的事件时，OSB1302写入高优先级队列1302a1或低优先级队列1302b1。另一代理可以从每个队列1302a1和/或1302b1读取，并且发布该事件以存储在CPS层1304内的事件数据库1326中。Java消息服务(JMS)1328可以用于执行用户接口1330、复杂事件处理1332的另一子系统、警报服务 1334与事件服务子系统1336之间的消息操作。事件服务子系统1338便于将用于存储的事件转发至事件数据库1326，并且处理用于从事件数据库1326检索所存储的事件的请求，其中，事件服务子系统1338可以包括在处理器上运行的机器可执行代码。

图5中示出的实施方式的重要优点在于，重要事件可以立即被“上推” 至CPS层1304，而所有事件也可以存储在装置1300处(即，通过数据库1314)。也可以从CPS层1304处的数据库1326或从数据库1314(例如，PostgreSQL数据库服务器)检索所存储的事件。图5中示出的体系结构还形成可容易升级的“分布式”事件记录和检索系统。这是因为每个装置1300将包括用于记录和检索高优先级事件和低优先级事件所需要的这些子系统。随着数据中心处的被管理设备的数量扩展，可以容易地添加装置1300以处理被管理设备，而无需修改CPS层1304或OSB1302。

现在参照图6，示出了具有用于获得、记录和检索数据点的分布式体系结构的装置1400。实际上，图5和图6两者示出的体系结构可以被合并到装置1300或装置1400中。

然而，该实施方式中的装置1400包括具有用于监视是否违背了预定义规则的阈值违背子系统1416a的CEP子系统1416。阈值违背子系统 1416a可以是在远程访问装置1400的处理器上运行的机器可执行代码。阈值违背(即，规则违背)子系统1416a可以检测何时违背了用户设置的阈值(即，规则)，例如何时所获得的数据点高于或低于阈值。具有一个或更多个聚合规则的聚合子系统1416b可以包括在CEP子系统1416中，以根据用户定义的聚合策略聚合所采集的数据点。数据点存储服务1412 可以用于接收数据点、更新与数据点有关的保留策略，以及将数据点异步写入数据库1414。可以包括在装置1400的处理器上运行的数据点查询服务1424(即，软件)，以通过日期范围、设备ID、数据点ID或通过任何其他用户期望的度量来查询数据点。

数据点采集器1408可以用于根据用户定义的策略来调度采集任务。元素库框架1406可以用于采集数据点，以基于用户选择的“值变化” (COV)生成数据点并且将最新的数据点值保存在其存储器中。通过 “COV”，其表示用户定义的变化量级如百分比或为绝对值。

元素库框架1406可以提供元素库(包括但不限于Java插件框架)的公共接口。元素库可以是允许管理(发现、采集、配置等)一组被管理设备的软件。元素库可以具有两个组件：被管理元素(或元素组)的“设备驱动器”、以及与被管理元素(或元素组)相关联的“产品知识”。设备驱动器组件可以包括与用于与被管理元素通信、命令受被管理元素等的协议相关的信息。另外，设备驱动器组件可以对从被管理设备发送的消息(数据等)提供标准化，将其标准化为DCIM系统100理解的公共标准，以及对从DCIM系统100发送到被管理设备的消息(数据等)提供去标准化。“产品知识”组件可以包含与和被管理元素相关联的各种操作特性有关的信息，包括但不限于被管理元素支持什么通信协议，以及什么数据点、什么事件、命令和阈值规则与被管理元素相关和/或由被管理元素采集。此外，由DCIM系统100使用的图形符号可以存储在元素库内。

虽然可以容易地实现两个以上的等级，但在该示例中聚合子系统 1416b提供了标记为“L1”和“L2”的两个聚合等级。在该示例中，数据库1414分开地存储与数据总线1410通信的L1聚合数据和L2聚合数据，如数据存储库1414a和1414b所示。数据存储库1414a(L1)可以聚合每五分钟获得的数据点，如通过每五分钟获得/更新运行平均而获得的数据点。数据存储1414b(L2)保持所采集的数据点的十五分钟的运行平均。以这种方式，极大地压缩存储的数据点的数量。一旦获得了新的运行平均，则可以丢弃先前的运行平均。也可以丢弃在先前间隔期间采集的数据点。数据库1414还可以包含L1聚合数据点和L2聚合数据点中每个的映射，聚合数据点包括被存储的L1数据点和L2数据点中每个的平均值、最小值和最大值。数据点可以被异步写入存储器。数据点输出服务1409 可以通过HTTPS协议将采集的数据点输出至OSB1402。可以对于长间隔的数据点异步地调用数据点输出服务1409。事件输出服务1411可以用于将事件输出至OSB1402。

OSB1402也可以具有至少两个通道：一个通道1402a，用于来自高优先级被管理设备(或可能地关键被管理设备)的数据点，以及第二通道 1402b，用于从作为非高优先级设备(即，非关键的被管理设备)的所有其他设备采集的数据点。在连接故障的情况下，可以将数据点写入数据库 1414。数据点还可以通过OSB1402、JMS(Java消息服务API)1428以及由在处理器上运行的机器可执行代码形成的数据点服务1437被向上输出至CPS层1404。CPS层1404也可以具有与JMS1428通信的CEP1432。数据点可以从数据点服务1437发送和存储在与CPS层1404相关联的时间序列数据库(TSD)1426中。如同装置1300，装置1400也可以包括服务管理控制器1418和MBeans服务器1420。服务管理控制器1418可以用于启动、停止、暂停、重新开始和更新D-总线上操作的所有服务的策略。MBeans服务器1420可以用于实现对服务管理控制器1418的远程访问。

根据关于图6的前述讨论，将理解的是，显著的优点在于，使用每个装置1400以“分布式”方式进行数据点的采集和聚合。这使得能够通过使用现有的装置1400或通过随着数据中心中的被管理设备的量增加而添加的新装置来容易地接纳新的被管理设备。重要地，在装置1400处发生数据点聚合，这意味着将动态地减少需要在网络上发送至CPS层1404的大量数据点信息。这显著降低了发送数据点相关信息时网络上使用的带宽。然而，同样重要的是，违背阈值策略的数据点可以直接生成事件，可以使用事件输出服务1411将该事件直接上发至CPS层1404。更进一步，用户或应用可以基本上实时地直接查询来自被管理设备的数据点，以及在数据库1414中查询存储且聚合的数据点。

现在参照图7，示出了稍微类似于装置1400的装置1500的另一实施方式。与装置1400的这些组件相同的组件使用比用于描述装置1400的那些附图标记增大100的附图标记来指定。在该示例中，装置1500利用在装置的处理器上运行的阈值监视服务1516a(即，软件)。如果违背阈值，则阈值监视服务1516a生成事件。数据库1515(例如，PostgreSQL数据库服务器)可以包括其中存储从某个标准或百分比改变预定的值变化的所生成的事件的COV(值变化)事件数据存储库1515a。也通过聚合服务 1516b执行L1和L2聚合，聚合服务1516b可以包括在装置1500的处理器上运行的机器可执行代码，聚合服务1516b独立于CEP子系统1516，并且将聚合的L1和L2数据点分别转发至L1数据库1514a和1514b。可以与数据总线1510通信的、由在装置1500的处理器上运行的机器可执行代码形成的数据点输出服务1509也直接从聚合服务1516b输出数据点。也由在适当的处理器上运行的机器可执行代码形成的数据点查询服务 1524处理通过OSB1502被路由至装置1500的来源于CPS层1504的数据点的查询。数据点输出服务1509也通过OSB1502和JMS1528将聚合的L2数据点上推至CPS层1504。包括在适当的处理器上运行的机器可执行代码的数据点出口服务1537指引聚合的L2数据点上推至与平台 1504相关联的时间序列数据库(TSD)1526以存储。

图8示出了使用通信路径和两个队列来分开地且同时地处理高优先级事件和正常优先级事件的高级实现。图8中示出的实现确保来自所有装置1600的事件的点对点保证传输。标记为“A1”和“B1”的箭头分别表示用于高优先级事件的点对点保证传输通信路径和发布/订阅通信路径。标记为“A2”和“B2”的箭头分别表示用于“正常”优先级(“非高”优先级)事件的点对点保证传输通信路径和发布/订阅通信路径。箭头B3和 B4表示可以由高优先级事件和正常优先级事件两者共享的通信路径。

OSB代理1700可以通过HTTPS协议传输从装置1600接收不同通道上的高优先级事件和低优先级事件两者。OSB代理1700使用变换服务 1702以变换和/或标准化高优先级事件和正常优先级事件两者，然后将标准化的事件传递至子系统1704，子系统1704在事件被发送至分开的队列 (如JMS(Java消息队列)队列1802(“高优先级”队列)和1804(“正常优先级”队列))之前将事件分离，其构成事件传输网络1800的一部分。发布/订阅子系统1806可以通过通信路径B3向与DCIM系统100的CPS 层1900相关联的事件查看器1902发布事件(高优先级和正常优先级两者)。分布/订阅子系统1806还可以向与CPS层1900相关联的警报处理 1904发布事件(高优先级和正常优先级两者)。

在操作中，装置1600可以向OSB代理1700发送同步的HTTP请求。 OSB代理1700将这些调用路由至JMS队列1802和1804。优选地，高优先级事件和正常优先级事件两者也存留到事件数据库1906。每个队列的用户仅接收一个消息。在用户不可使用的情况下，消息可以被传输直到满足期满策略。优选地，该策略与存留在每个装置1600上的事件的保留策略相同。优选地，该策略也是通过管理控制台可配置的。该配置的优点是如果大量事件被报告并且CPS1900不能够跟上被传输的事件，则事件可以在队列1802和/或1804处排队。

图9示出了稍微类似于图8的实施方式的另一实施方式2000。实施方式2000检测事件传输网络1800内的高优先级事件，并且根据对于事件查看器1902的发布/订阅策略以保证方式将事件存留到数据库1906用于事件存储和传输。实施方式2000还将事件存留到警报处理1904。来自关键设备和非关键设备两者的数据点以及COV事件可以根据发布/订阅策略全部被传输至CPS层1900。

虽然已经描述了各种实施方式，但是本领域技术人员将认识到在不偏离本公开内容的情况下可以进行修改或变型。示例示出各种实施方式且并不意在限制本公开内容。因此，本说明书和权利要求书应当被自由地解释，而仅具有鉴于相关的现有技术所必需的限制。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 包含可管理性子系统以实时监视和管理数据中心资源的系统和方法 [P] . 中国专利： CN103999077A . 2014-08-20
2. 包含可管理性子系统以实时监视和管理数据中心资源的方法 [P] . 中国专利： CN103999077B . 2016.12.21
3. System and method for monitoring and managing data center resources in real time incorporating manageability subsystem [P] . 美国专利： US10061371B2 . 2018-08-28

机译：包含可管理性子系统的实时监控和管理数据中心资源的系统和方法
4. System and method for monitoring and managing data center resources in real time incorporating manageability subsystem [P] . 美国专利： US9680716B2 . 2017-06-13

机译：包含可管理性子系统的实时监控和管理数据中心资源的系统和方法
5. SYSTEM AND METHOD FOR MONITORING AND MANAGING DATA CENTER RESOURCES IN REAL TIME INCORPORATING MANAGEABILITY SUBSYSTEM [P] . 欧洲知识产权局专利： EP2625614B1 . 2019-04-17

机译：实时合并管理子系统中数据中心资源的监视和管理系统和方法