首页> 中国专利> 一种Micro TCA系统、Micro TCA系统管理方法

一种Micro TCA系统、Micro TCA系统管理方法

摘要

本发明公开了一种小型电信和计算通用硬件平台架构Micro TCA系统,包括交换控制模块及多个先进夹层卡,所述先进夹层卡中,至少有两个先进夹层卡通过先进夹层卡互连通道相连接。本发明还公开了一种Micro TCA系统管理方法。通过本发明,使一个先进夹层卡与另一个或多个先进夹层卡通过先进夹层卡互连通道相连接,形成一组或多组对板,从而为先进夹层卡提供了冗余智能平台管理总线通道,从而使该先进夹层卡与交换控制模块的通信有冗余的智能平台管理总线通道可供选择使用。

著录项

  • 公开/公告号CN101399673A

    专利类型发明专利

  • 公开/公告日2009-04-01

    原文格式PDF

  • 申请/专利权人 华为技术有限公司;

    申请/专利号CN200710030689.2

  • 发明设计人 陈成;洪峰;李善甫;

    申请日2007-09-30

  • 分类号H04L12/02;H04Q1/00;H05K7/00;

  • 代理机构广州三环专利代理有限公司;

  • 代理人郝传鑫

  • 地址 518129 广东省深圳市龙岗区坂田华为总部办公楼

  • 入库时间 2023-12-17 21:40:45

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-11-16

    未缴年费专利权终止 IPC(主分类):H04L12/02 授权公告日:20111102 终止日期:20150930 申请日:20070930

    专利权的终止

  • 2011-11-02

    授权

    授权

  • 2009-05-27

    实质审查的生效

    实质审查的生效

  • 2009-04-01

    公开

    公开

说明书

技术领域

本发明涉及智能平台通信技术领域,具体地涉及一种小型电信和计算通用硬件平台架构(Micro Telecommunications Computing Architecture,Micro TCA)Micro TCA系统及Micro TCA系统管理方法。

背景技术

Micro TCA是周边元件扩展接口(Pedpherd Component Interconnect,PCI)工业计算机厂家协会(PCI Industrial Computer Manufacturers Group,PICMG)组织制定的小型电信和计算通用硬件平台架构,Micro TCA利用先进夹层卡(Advanced Mezzanine Card,AMC)来构筑系统,支持热插拔的AMC可以直接插到Micro TCA的背板。Micro TCA基本规范是MicroTCA.0,定义了MicroTCA的机框结构、管理、电源、散热、互连等内容。

AMC是PICMG组织定义的可以支持热插拔的通用夹层卡,具体类型包括数字信号处理(Digital Signal Processing,DSP)AMC、中央处理器(CentralProcessing Unit,CPU)AMC、网络处理器(Network Processor,NP)AMC、接口AMC、存储AMC等类型。AMC模块可以直接插到Micro TCA的背板上来应用,构成Micro TCA系统。AMC规范包括AMC.X系列标准规范,定义了AMC的结构、管理、电源、散热、互连及交换网建议等内容。

智能平台管理接口(Intelligent Platform Management Interface,IPMI),是Intel、HP、NEC、Dell等公司为提高服务器的可用性指标而推出的智能化平台管理接口标准,最初目的是为服务器提供设备管理、传感器/事件管理、用户管理、风扇框/电源框管理、远程维护等功能。Micro TCA规范和AMC规范均将IPMI规范定义为需要遵循的管理规范。

智能平台管理总线(Intelligent Platform Management Bus,IPMB),是基于IPMI规范的管理总线的统称。在Micro TCA中IPMB总线又分为两种,IPMB-0和本地智能平台管理总线(Local Intelligent Platform Management Bus,IPMB-L)。其中IPMB-0连接Micro TCA系统中的Micro TCA承载管理控制器(Micro TCACarrier Manager Controller,MCMC)和增强模块管理控制器(EnhancedManagement Controller,EMMC),实现Micro TCA的交换控制模块(Micro TCACarrier Hub,MCH)对电源模块和风扇单元的管理。而IPMB-L连接Micro TCA系统中的MCMC和模块管理控制器(Management Controller,MMC),实现MCH对各AMC模块的管理。

图1是Micro TCA规范中定义的IPMB-L管理总线的架构示意图。根据MicroTCA的规范,一个基本的Micro TCA系统支持的AMC数量最大为12,支持的MCH数量最大为2,所支持的两块MCH可以互为冗余备份关系。

在AMC规范中,只给AMC模块定义了一个IPMI接口,应用于IPMB总线的连接,该IPMI接口由AMC模块的MMC来提供。在Micro TCA规范中,每块MCH都定义了12个用于与AMC进行管理互连的IPMI接口,这些接口由MCH的MCMC来提供。Micro TCA规范采用星型拓扑的IPMB-L管理总线架构,MCH1的12个IPMI接口通过12条IPMB-L总线分别与12块AMC的IPMI接口连接,而MCH2的12个IPMI接口也通过12条IPMB-L总线分别与12块AMC的IPMI接口连接,从而构成了两块MCH与各AMC间的Y型IPMB-L总线连接。另外,Micro TCA规范中还定义了MCH间互连IPMB-L总线,连接主备MCH上的MCMC,可应用于MCH间管理信息的交互。

图1所示的IPMB-L管理总线架构中,存在两块MCH,他们互为冗余备份关系。在此将MCH1定义为主用MCH,而将MCH2定义为备用MCH。正常情况下,MCH1处于激活状态,MCH1通过IPMB-L总线实现对各个AMC的管理,而MCH2此时处于备份(非激活)的状态,不参与AMC的管理工作。在MCH1发生故障的情况下,主备MCH将进行备份倒换,激活MCH2,而MCH1则转换成备份(非激活)转态,由MCH2接管MCH1的工作,接管对各AMC的管理。

在Micro TCA规范的IPMB-L管理总线架构中,每个AMC发生通信故障的可能故障点有两个,如图2所示,以AMC1的IPMB-L总线故障为例进行说明。故障点1位于AMC1 Y型IPMB-L总线连接汇接点的上方,如MCH1中MCMC上的IPMI接口发生故障;故障点2位于AMC1 Y型IPMB-L总线连接汇接点的下方,如AMC的MMC上的IPMI接口发生故障。

当故障点1发生故障时,有两种可能的情况:开路类型和短路类型。当开路类型的故障发生时,MCH1与AMC1间的IPMB-L总线断开,MCH1无法对AMC1进行管理。此时,可以通过MCH的备份倒换动作,激活MCH2,由MCH2来接替MCH1的工作,通过MCH2与AMC1间的IPMB-L总线来接续对AMC的管理工作。

当短路类型的故障发生时,MCH1与AMC1间的IPMB-L总线短路,MCH1无法对AMC1进行管理。由于IPMB-L总线是Y型结构的,MCH2与AMC1间的IPMB-L总线连接也将被挂死,即使进行倒换,MCH2也无法实现对AMC1的正常管理,则该Micro TCA系统对AMC1的管理将丢失。

当故障点2发生故障时,MCH1与AMC1间的IPMB-L总线、MCH2与AMC1间的IPMB-L总线均无法正常工作,该Micro TCA系统对AMC1的管理将丢失。

综上所述,因为在AMC上只定义了一个IPMI接口,导致Micro TCA规范定义的IPMB-L管理总线架构在某些情况下出现单点故障,导致MCH与AMC的通信中断,Micro TCA系统无法对AMC进行正常的配置和管理,降低了系统的可靠性。

发明内容

本发明所要解决的技术问题在于,提供一种可靠性较佳的Micro TCA系统及Micro TCA系统管理方法。

一种小型电信和计算通用硬件平台架构Micro TCA系统,包括交换控制模块及多个先进夹层卡,所述交换控制模块通过智能平台管理总线通道与所述多个先进夹层卡中的每一个相连接,所述多个先进夹层卡中至少有两个先进夹层卡通过先进夹层卡互连通道相连接;

其中,所述先进夹层卡互连通道为一个先进夹层卡与其它先进夹层卡相连接形成的通道,用于在所述两个先进夹层卡之间传输智能平台管理信息。

一种Micro TCA系统管理方法,其在Micro TCA系统上实现,包括:

当某一先进夹层卡与所述交换控制模块的智能平台管理总线通信出现故障时,使用由先进夹层卡互连通道所形成的冗余总线通道与所述交换控制模块进行智能平台管理总线通信;

其中,所述先进夹层卡互连通道为一个先进夹层卡与其它先进夹层卡相连接形成的通道,用于在所述两个先进夹层卡之间传输智能平台管理信息。

上述Micro TCA系统,使一个先进夹层卡与另一个或多个先进夹层卡通过先进夹层卡互连通道相连接,从而为先进夹层卡提供了冗余智能平台管理总线通道,即该先进夹层卡的先进夹层卡互连通道加上该先进夹层卡的对板到交换控制模块的智能平台管理总线通道,从而使该先进夹层卡与交换控制模块的智能平台管理总线通信有冗余的通道可供选择使用。

上述Micro TCA系统管理方法,当检测到交换控制模块与一个先进夹层卡的智能平台管理总线通信发生故障时,从出现故障的总线通道倒换到由该先进夹层卡的先进夹层卡互连通道所形成的冗余总线通道上与交换控制模进行智能平台管理总线通信,从而在出现单点故障的情况下能保障该先进夹层卡与交换控制模进行智能平台管理总线通信。

附图说明

图1是现有技术中Micro TCA规范中定义的IPMB-L管理总线的架构示意图;

图2是现有技术中IPMB-L总线架构的故障示意图;

图3是本发明中Micro TCA系统实施例一的组成示意图;

图4是本发明中Micro TCA系统实施例二的组成示意图;

图5是本发明Micro TCA系统实施例三的功能模块组成示意图;

图6是本发明Micro TCA系统实施例四的功能模块组成示意图;

图7是本发明Micro TCA系统实施例五的功能模块组成示意图;

图8是本发明Micro TCA系统实施例六的功能模块组成示意图;

图9是本发明Micro TCA系统实施例七的功能模块组成示意图;

图10是本发明Micro TCA系统实施例八的功能模块组成示意图;

图11是本发明Micro TCA系统管理方法实施例二的流程示意图;

图12是图11中步骤S111的一具体实施方式的流程示意图;

图13是图11中步骤S111的一应用实施例的示意图。

具体实施方式

下面结合附图对本发明作进一步详细清楚的说明。

图3示出了本发明中Micro TCA系统实施例一的组成示意图,包括交换控制模块1、先进夹层卡2(AMC1)、先进夹层卡3(AMC2)、先进夹层卡4(AMC3)、先进夹层卡5(AMC4)。交换控制模块1分别通过智能平台管理总线通道I、II、III、IV与AMC1、AMC2、AMC3、AMC4相连接,并通信。在图3所示的实施例中,AMC1和AMC2相连接,我们称连接它们的通道为先进夹层卡互连通道,AMC1和AMC2通过先进夹层卡互连通道相连。同样,在图3中,AMC3和AMC4也通过先进夹层卡互连通道相连接。先进夹层卡互连通道为一先进夹层卡与另一先进夹层卡之间的连接通道,用于在所述两个先进夹层卡之间传输信息,例如,传输IPMB控制信息。我们定义,由先进夹层卡互连通道连接起来的两个先进夹层卡互为对板。先进夹层卡互连通道的出现使系统形成了冗余的智能平台管理总线通道,例如,AMC1除了可以通过智能平台管理总线通道I与交换控制模块通信外,还可以通过它与AMC2间的先进夹层卡互连通道及智能平台管理总线通道II与交换控制模块通信;同样,由于有了先进夹层卡互连通道,AMC2、AMC3、AMC4都有冗余的总线通道可供选择使用。在本实施例中,AMC1和AMC2互为对板,AMC3和AMC4互为对板,在实际应用中,各AMC的对板并不限定,即,每个AMC可以任意选择一个其它的AMC作为自己的对板。作为另一种实施方式,每个先进夹层卡可以有多个对板,例如,还可以将AMC1和AMC3通过先进夹层卡互连通道相连接,则,AMC1的对板有两个:AMC2和AMC3。

本发明Micro TCA系统的实施例提供了先进夹层卡互连通道,为先进夹层卡提供了冗余智能平台管理总线通道,从而使该先进夹层卡与交换控制模块的智能平台管理总线通信有冗余的智能平台管理总线通道可供选择使用。

作为一种实施方式,交换控制模块通常包括两个交换控制器:第一交换控制器(MCH1)、第二交换控制器(MCH2)。MCH1通过主用智能平台管理总线通道与各AMC相连接,MCH2通过备用智能平台管理总线通道与各AMC相连接。通常,通过IPMB互连总线通道将MCH1和MCH2连接起来。MCH1和MCH2的工作状态一个为激活,一个为备份,二者的工作状态可以倒换。即,MCH1和MCH2是互为主、备份的,正常情况下交换控制模块使用主用智能平台管理总线通道与各AMC通信,即MCH1处于激活状态,MCH2处于备份状态;当主用智能平台管理总线通道或MCH1发生故障时,可以使用备用智能平台管理总线通道与各AMC通信,即MCH1处于备份状态,MCH2处于激活状态。在本实施例中,即使当一先进夹层卡的主、备用智能平台管理总线通道都发生故障时,还可以使用由先进夹层卡互连通道形成的冗余总线通道与交换控制模块通信。

根据AMC规范的定义,每个AMC有20个端口,其中,端口0~11、端口16已有明确的应用定义,其余的几个端口尚未定义。作为一种实施方式,可以利用AMC的端口12~15、端口17~20作为先进夹层卡互连通道的连接端口。即可以将一AMC的端口12~15、端口17~20中的任一个与另一AMC的端口12~15、端口17~20中的任一个相连接,形成先进夹层卡互连通道。当然,也可以利用端口12~15、端口17~20以外的其它端口实现先进夹层卡互连通道的连接。

在上述实施例中,作为一种实施方式,MCH1和MCH2之间的IPMB互连总线通道可以为互连IPMB-L,也可以为更新通道(Update Channel)或交叉通道(Cross-over Channel)。

图4为本发明Micro TCA系统实施例二的组成示意图,包括交换控制模块41、第一先进夹层卡(AMC1)42、第二先进夹层卡(AMC2)43。交换控制模块41包括第一交换控制器(MCH1)44与第二交换控制器(MCH2)45,MCH1和MCH2互为主备份,二者通过IPMB互连总线通道(路径5)相连接。MCH1通过两条主(备)用智能平台管理总线通道(路径1和路径3)分别与AMC1和AMC2相连接。MCH2通过两条备(主)用智能平台管理总线通道(路径2和路径4)分别与AMC1和AMC2相连接。其中,AMC1和AMC2间有先进夹层卡互连通道(路径6)相连接。在本实施例中,由于AMC1和AMC2间有先进夹层卡互连通道(路径6)相连接,除了主、备用智能平台管理总线通道,交换控制模块1还有冗余总线通道到AMC1和AMC2,如下列各表所示。

表1 MCH1到AMC1的总线通道的路径组合表

 

通道序号路径组合1路径12路径3+路径63路径5+路径24路径5+路径4+路径6

表2 MCH2到AMC1的总线通道的路径组合表

 

通道序号路径组合1路径22路径4+路径63路径5+路径14路径5+路径3+路径6

表3 MCH1到AMC2的总线通道的路径组合表

 

通道序号路径组合1路径32路径1+路径63路径5+路径44路径5+路径2+路径6

表4 MCH2到AMC2的总线通道的路径组合表

 

通道序号路径组合1路径42路径2+路径63路径5+路径34路径5+路径1+路径6

表1为MCH1到AMC1的总线通道的路径组合表,由表1可知,由于存在先进夹层卡互连通道(路径6),MCH1到AMC1的总线通道增加了两条冗余通道:通道2:路径3+路径6,通道4:路径5+路径4+路径6。由图4可知,当B处出现故障,或A处出现短路故障时,通道1和通道3均不可再使用,但由于路径6的存在,还可以选择使用冗余总线通道2或4保持AMC1与MCH1的通信。由图4可知,不论A处或B处出现何种单点故障,通道2和通道4都可用。即使当MCH2出现故障(路径5不可用)时,还可以使用通道2保持AMC1与MCH1的通信。同样,分析图4及表2、表3、表4可知,不论A、B、C、D中任一处出现何种单点故障,交换控制模块1都有冗余的总线通道到AMC1或AMC2。

在另一种情况下,例如,当MCH1发生故障,MCH2由备份状态倒换到工作状态,由表2可知,MCH2到AMC1可用的总线通道有通道1和通道2,这时,不论A、B、C、D中任一处出现何种单点故障,MCH2都有通道1或通道2到AMC1。对AMC2的分析与此相似,此处不再赘述。

综上,不论A、B、C、D中任一处出现何种单点故障,且MCH1和MCH2中的一个发生故障,本实施例中交换控制模块1总有冗余总线通道到AMC1和AMC2。

在上述实施例中,各先进夹层卡的对板信息是存储于一存储单元的,以备查询使用。该存储单元可以位于Micro TCA系统内,例如,位于交换控制模块上,也可以位于Micro TCA系统之外,例如位于MicroTCA承载信息器件中,MCH通过访问承载信息器件可以获取这些对板信息。所述对板信息包括:各AMC与其对板的对应关系,各组对板间的先进夹层卡互连通道是通过什么端口连接形成的。

为实现从出现故障的总线通道到冗余总线通道的倒换,作为一种实施方式,Micro TCA系统还可以包括倒换控制单元,用于当所述先进夹层卡与所述交换控制模块的通信出现故障时,从出现通信故障的总线通道倒换到由先进夹层卡互连通道形成的冗余总线通道上进行通信。该倒换控制单元可以位于交换控制模块上,也可以位于交换控制模块之外。如图5所示,为本发明Micro TCA系统实施例三的功能模块组成示意图,包括有交换控制模块41、第一先进夹层卡(AMC1)42、第二先进夹层卡(AMC2)43及倒换控制单元52。其中,倒换控制单元52位于交换控制模块41上。

图6为本发明Micro TCA系统实施例四的功能模块组成示意图,包括交换控制模块41、第一先进夹层卡(AMC1)42、第二先进夹层卡(AMC2)43及倒换控制单元52,作为一种实施方式,倒换控制单元52包括查询单元521、决策单元522、倒换单元523。

查询单元521用于查询出现通信故障的所述先进夹层卡的对板信息;决策单元522用于根据所述查询单元521获得的所述对板信息生成处理策略;倒换单元523用于根据所述决策单元522生成的处理策略,从出现故障的总线通道倒换到由所述先进夹层卡互连通道形成的冗余总线通道上进行通信。

作为一种实施方式,所述处理策略的内容包括:是否倒换交换控制模块的第一交换控制器与第二交换控制器的工作状态,及倒换到哪条冗余总线通道继续通信,等。

图7为本发明Micro TCA系统实施例五的功能模块组成示意图,包括交换控制模块41、第一先进夹层卡(AMC1)42、第二先进夹层卡(AMC2)43及倒换控制单元52,作为一种实施方式,倒换控制单元52除包括查询单元521、决策单元522、倒换单元523外,还包括通道侦听单元524,用于根据查询单元521获得的对板信息发起通道侦听,并根据通道侦听的结果确定可使用的冗余总线通道;决策单元522根据通道侦听单元524的确定结果生成处理策略;倒换单元523根据所述处理策略,从出现故障的总线通道倒换到由所述先进夹层卡互连通道形成的冗余总线通道上进行通信。

图8为本发明Micro TCA系统实施例六的功能模块组成示意图,包括交换控制模块41、第一先进夹层卡(AMC1)42、第二先进夹层卡(AMC2)43及倒换控制单元52;倒换控制单元52包括查询单元521、决策单元522、倒换单元523、通道侦听单元524;其中,作为一种实施方式,通道侦听单元524包括发起单元5241、识别单元5242、确定单元5244。

发起单元5241用于根据查询单元521查询到的对板信息,对由发生故障的先进夹层卡的先进夹层卡互连通道形成的冗余总线通道发起通道侦听。所谓发起通道侦听,即在所述冗余总线通道上发送通道侦听报文。随后,通过判断是否能够收到应答报文就能判断该冗余总线通道是否可用。所述通道侦听报文及其应答报文的报文格式与通常的IPMI命令报文的格式相同,一般包括请求者地址、应答者地址、命令类型、数据内容。在命令类型项中,对应于通道侦听报文及其应答报文的类型为通道侦听。通道侦听报文的请求者地址为发出该报文的设备的地址,应答者地址为被侦听的冗余通道上该设备的下一跳设备的地址,目的地址为发生通信故障的先进夹层卡的地址,该目的地址包含在通道侦听报文的数据内容中。应答报文的数据内容中包含有请求确认信息及该应答报文经过的路径信息。

识别单元5242用于识别接收到的通道侦听报文及其应答报文;其根据报文的命令类型项识别出通道侦听报文及其应答报文,并识别出所述通道侦听报文及其应答报文的请求者地址、应答者地址及数据内容,从而根据数据内容中是否包含请求确认信息识别出所述报文是否是应答报文。

确定单元5244根据接收到的应答报文确定可使用的冗余总线通道。由于应答报文的数据内容中包含有经过的路径信息,因此,确定单元5244可以根据应答报文数据内容中的路径信息确定可使用的冗余总线通道。

一般地,当交换控制模块包含有一个交换控制器时,倒换控制单元可以只包含一个与该交换控制器对应的通道侦听单元;在这种情况下,该通道侦听单元只需发起通道侦听,识别接收到的应答报文,并根据接收到的应答报文确定可使用的冗余总线通道。当交换控制模块包含两个互为主、备份的交换控制器时,作为一种实施方式,倒换控制单元可以包含两个通道侦听单元,分别对应于两个交换控制器;在这种情况下,通道侦听单元还需根据通道侦听报文或应答报文的请求者地址、应答者地址、数据内容,将所述通道侦听报文或应答报文转发,或者应答所述通道侦听报文。

如图9所示,为本发明Micro TCA系统实施例七的功能模块组成示意图,包括交换控制模块41、第一先进夹层卡(AMC1)42、第二先进夹层卡(AMC2)43及倒换控制单元52,倒换控制单元52包括查询单元521、决策单元522、倒换单元523、通道侦听单元524,作为一种实施方式,通道侦听单元524除包括发起单元5241、识别单元5242、确定单元5244外,还包括有处理单元5243,用于根据识别单元5242识别出的所述通道侦听报文及其应答报文的请求者地址、应答者地址、数据内容,将所述通道侦听报文及其应答报文转发,或者应答所述通道侦听报文。发起单元5241当其所在的通道侦听单元对应的交换控制器为主用时(处于工作状态而不是备份状态时),根据查询到的对板信息对冗余总线通道发起通道侦听,否则,当其所在的通道侦听单元对应的交换控制器为备用时(处于备份状态而不是工作状态时),其不动作。

处理单元5423判断接收到的通道侦听报文的目的地址是否为其对应的交换控制器的地址,若判断结果为是,则发送应答报文给向其发送该通道侦听报文的设备,所述应答报文的请求者地址、应答者地址与该通道侦听报文的一致,在应答报文的数据内容中包含有请求确认信息;若判断结果为否,则处理单元5423将继续转发该通道侦听报文:处理单元5423将该通道侦听报文的请求者地址变为其对应的交换控制器的地址,并根据查询单元521查询到的对板信息将应答者地址变为发生通信故障的AMC的对板的地址,保持目的地址不变,向发生故障的AMC的对板发送该通道侦听报文。若发生通信故障的AMC的对板不止一个,则处理单元5243将分别向其发送应答者地址与其地址一致的通道侦听报文。

在接收到下一跳设备发送过来的应答报文时,处理单元5243判断其自身是否收到过别的设备发送过来的通道侦听报文,若收到过,则对向其发送该通道侦听报文的设备回复应答报文,所述应答报文的请求者地址、应答者地址与该通道侦听报文的一致,数据内容中包含的路径信息包括接收到的应答报文的数据内容中包含的路径信息,及该应答报文由下一跳设备到达本交换控制器所经过的路径信息;若没有收到过别的设备发送过来的通道侦听报文,则通知确定单元5244确认可使用的冗余总线通道。确定单元5244根据该应答报文数据内容中包含的路径信息,确认与该路径信息相关的冗余总线通道可用。

在倒换到由先进夹层卡互连通道形成的冗余总线通道上通信后,由于IPMI命令的报文只包含请求者地址(即主用MCH的地址)和应答者地址(即目的先进夹层卡的地址),则必须使处于该冗余总线通道上的目的先进夹层卡的对板能够透传发送给目的先进夹层卡的IPMI命令报文。如果备用交换控制器也处于该冗余总线通道上,则备用交换控制器也必须能够透传IPMI命令报文。因此,作为一种实施方式,Micro TCA系统还包括透传单元525,如图10所示为MicroTCA系统实施例八的功能模块组成示意图,包括交换控制模块41、第一先进夹层卡(AMC1)42、第二先进夹层卡(AMC2)43、倒换控制单元52及透传单元53,透传单元53用于当倒换控制单元52控制IPMB通信从发生故障的总线通道倒换到由先进夹层卡互连通道形成的冗余总线通道后,命令所述交换控制模块及先进夹层卡将接收到的应答者地址不是其地址的报文透传。此处的先进夹层卡包括发生通信故障的AMC的对板,也可以包括全部AMC。透传单元53可以位于交换控制模块41之内也可以位于其之外,在图10所示的实施例中,透传单元53位于交换控制模块41之内。

本发明还提供一种Micro TCA系统管理方法,其实施例一的流程步骤包括:

当某一先进夹层卡与所述交换控制模块的智能平台管理总线通信出现故障时,使用由先进夹层卡互连通道所形成的冗余总线通道与所述交换控制模块进行智能平台管理总线通信;

其中,所述先进夹层卡互连通道,为所述先进夹层卡与其它先进夹层卡相连接形成的通道,用于在所述两个先进夹层卡之间传输智能平台管理信息,例如传输IPMB控制信息。作为一种实施方式,可以将一先进夹层卡的端口12~15、端口17~20中的任一个与另一先进夹层卡的端口12~15、端口17~20中的任一个相连接,形成先进夹层卡互连通道。当然,也可以利用端口12~15、端口17~20以外的其它端口实现先进夹层卡互连通道的连接。我们定义,由先进夹层卡互连通道相连接的两个先进夹层卡互为对板。

通过本发明Micro TCA系统管理方法实施例,当检测到交换控制模块与一先进夹层卡的智能平台管理总线通信发生故障时,从出现故障的总线通道倒换到由该先进夹层卡的先进夹层卡互连通道所形成的冗余总线通道上与交换控制模块进行智能平台管理总线通信,从而在出现单点故障的情况下能保障该先进夹层卡与交换控制模块进行智能平台管理总线通信。

交换控制模块一般包括两个互为主、备用的交换控制器:第一交换控制器(MCH1)和第二交换控制器(MCH2),二者的工作状态(激活或备份)可以相互倒换。作为一种实施方式,在发生通信故障时,可以根据冗余总线通道的情况选择是否倒换MCH1和MCH2。因此,作为一种实施方式,在使用由先进夹层卡互连通道所形成的冗余总线通道与所述交换控制模块进行智能平台管理总线通信的步骤之前,还可以包括下列步骤:将所述交换控制模块的第一交换控制器与第二交换控制器倒换工作状态。然后再使用由先进夹层卡互连通道形成的冗余总线通道通信。

由图4可知,由先进夹层卡互连通道形成的冗余总线通道可能不止一条,在使用冗余的总线通道进行通信之前,可以先验证冗余总线通道的可使用性,确定有哪些冗余总线通道可以使用,然后再选择一条冗余总线通道进行倒换,如图11所示,示出了本发明Micro TCA系统管理方法的实施例二的流程示意图,包括:

步骤S111:当某一先进夹层卡与所述交换控制模块的智能平台管理总线通信出现故障时,使用智能平台管理总线通道侦听命令检测并确定可使用的冗余总线通道。

步骤S112:根据检测确定的结果生成处理策略。

在所述处理策略中确定了要使用的冗余总线通道。

如果在故障发生后交换控制模块的MCH1和MCH2没有倒换,这里,作为一种实施方式,处理策略的内容可以包括:确定是否倒换MCH1和MCH2的工作状态,及确定使用哪条冗余总线通道。如果故障发生后交换控制模块的MCH1和MCH2已经发生了倒换,这里,处理策略的内容可以包括:确定使用哪条冗余总线通道。

步骤S113:执行所述处理策略,使用由先进夹层卡互连通道形成的冗余总线通道与所述交换控制模块进行智能平台管理总线通信。

如果处理策略决定要倒换MCH1和MCH2的工作状态,则在本步骤里需要执行该倒换工作状态的工作,并使用处理策略确定的冗余总线通道通信。

图12示出了步骤S111的一具体实施方式的流程示意图,包括:

步骤S121:查询出现通信故障的所述先进夹层卡的对板信息。

在Micro TCA系统中,配置好先进夹层卡的对板后,应存储对板信息,所述对板信息包括:各先进夹层卡对应的对板,每组对板的先进夹层卡互连通道是由什么端口连接而成的,等。作为一种实施方式,对板信息可以存储在MicroTCA承载信息器件中,交换控制模块通过访问承载信息器件获得对板信息。

步骤S122:经由所述先进夹层卡的对板向所述先进夹层卡发送通道侦听报文。

通道侦听的目的是检测冗余总线通道是否可用,因此,通道侦听报文所经过的路径为:由交换控制模块到发生通信故障的AMC的对板,然后再经过先进夹层卡互连通道到达发生通信故障的AMC。因此,当一AMC发生通信故障时,交换控制模块根据查询到的其对板的信息,向其对板发送通道侦听报文,再由其对板转发给该AMC。通道侦听报文的格式同一般的IPMI命令报文的格式一样,通常包括请求者地址、应答者地址、命令类型、数据内容等。通道侦听报文的命令类型为通道侦听,可以从命令类型字段识别出通道侦听报文。

交换控制模块通常包括两个互为主、备用的交换控制器:第一交换控制器(MCH1)和第二交换控制器(MCH2),二者通过IPMB互连通道相连接。

当MCH1工作于激活状态,MCH2工作于备份状态时,由MCH1发起通道侦听:MCH1向发生通信故障的AMC的对板发送通道侦听报文,该通道侦听报文的请求者地址为MCH1的地址,应答者地址为该对板的地址,该通道侦听报文的目的地址包含在报文的数据内容中,为发生故障的AMC的地址;该对板收到该通道侦听报文后发现目的地址不是其自身地址,则继续转发该通道报文,将该通道侦听报文的请求者地址变为自身地址,将应答者地址变为其对板——发生故障的AMC的地址,将该通道侦听报文转发给发生故障的AMC。同时,MCH1还通过IPMB互连通道向MCH2发送通道侦听报文,该通道侦听报文的请求者地址为MCH1的地址,应答者地址为MCH2的地址,数据内容中的目的地址为发生通信故障的AMC的地址;MCH2收到该通道侦听报文后,继续转发该通道侦听报文,将该通道侦听报文的请求者地址变为自身地址,将应答者地址变为发生通信故障的AMC的对板的地址,将该通道侦听报文转发给发生通信故障的AMC的对板;该对板接收后,将通道侦听报文的请求者地址变为自身地址,将应答者地址变为其对板——发生故障的AMC的地址,将该通道侦听报文转发给发生故障的AMC。

与此相类似,当MCH2工作于激活状态,MCH1工作于备份状态时,由MCH2发起通道侦听:MCH2向发生通信故障的AMC的对板发送通道侦听报文,该通道侦听报文的请求者地址为MCH2的地址,应答者地址为该对板的地址,该通道侦听报文的目的地址包含在报文的数据内容中,为发生故障的AMC的地址;该对板收到该通道侦听报文后发现目的地址不是其自身地址,则继续转发该通道报文,将该通道侦听报文的请求者地址变为自身地址,将应答者地址变为其对板——发生故障的AMC的地址,将该通道侦听报文转发给发生故障的AMC。同时,MCH2还通过IPMB互连通道向MCH1发送通道侦听报文,该通道侦听报文的请求者地址为MCH2的地址,应答者地址为MCH1的地址,数据内容中的目的地址为发生通信故障的AMC的地址;MCH1收到该通道侦听报文后,继续转发该通道侦听报文,将该通道侦听报文的请求者地址变为自身地址,将应答者地址变为发生通信故障的AMC的对板的地址,将该通道侦听报文转发给发生通信故障的AMC的对板;该对板接收后,将通道侦听报文的请求者地址变为自身地址,将应答者地址变为其对板——发生故障的AMC的地址,将该通道侦听报文转发给发生故障的AMC。

步骤S123:接收经由所述先进夹层卡的对板、来自所述先进夹层卡的应答报文。

发生故障的AMC收到交换控制模块经由其对板发送过来的通道侦听报文后,向其对板发送应答报文,其对板将应答报文转发至交换控制模块。应答报文的格式同一般的IPMI命令报文的格式也相同,包括请求者地址、应答者地址、命令类型、数据内容等。应答报文的命令类型也是通道侦听。应答报文的数据内容中包含有请求确认信息,这是与通道侦听报文的不同之处。

发生通信故障的AMC收到通道侦听报文后,发现报文数据内容中的目的地址为其自身地址,则对该通道侦听报文回应应答报文,即发送应答报文给向其发送该通道侦听报文的对板,所述应答报文的请求者地址是该对板的地址,应答者地址是该发生通信故障的AMC的地址,这些都与该通道侦听报文一致。在该应答报文的数据内容中包含有请求确认信息。对板收到该应答报文后,继续向交换控制模块回应应答报文:由于对板分别收到来自MCH1和MCH2的通道侦听报文,所以,该对板分别向MCH1和MCH2回应对应的应答报文,所述应答报文的数据内容中包含有请求确认信息及应答报文从发生故障的AMC到达该对板所经过的路径信息。

当MCH1工作于激活状态,MCH2工作于备份状态时,MCH2收到来自对板的应答报文后,回应来自MCH1的通道侦听报文,即,继续向MCH1回复应答报文,该应答报文的数据内容中包含请求确认的信息,及应答报文从发生故障的AMC经由其对板到达MCH2所经过的路径信息。

当MCH2工作于激活状态,MCH1工作于备份状态时,MCH1收到来自对板的应答报文后,回应来自MCH2的通道侦听报文,即,继续向MCH2回复应答报文,该应答报文的数据内容中包含请求确认的信息,及应答报文从发生故障的AMC经由其对板到达MCH1所经过的路径信息。

步骤S124:根据所述应答报文确定可使用的冗余总线通道。

如果交换控制模块收到了经由发生通信故障的AMC的对板发送过来的应答报文,则交换控制模块就可以确定该应答报文或其对应的通道侦听报文所经过的冗余总线通道是可用的。由于应答报文的数据内容中包含有相关的路径信息,因此,交换控制模块,可以根据应答报文确定哪些冗余总线通道可以使用。

当MCH1工作于激活状态,MCH2工作于备份状态时,由MCH1来根据应答报文确定哪些冗余总线通道可以使用;当MCH2工作于激活状态,MCH1工作于备份状态时,由MCH2来根据应答报文确定哪些冗余总线通道可以使用。

图13为图11中步骤S111的一应用实施例示意图。如图13所示,MCH1和MCH2为交换控制模块的两个互为主、备用的交换控制器,二者通过IPMB互连通道(路径5)相连接。AMC1和AMC2为互为对板的一对先进夹层卡,二者通过先进夹层卡互连通道(路径6)相连接。MCH1分别通过路径1和路径3连接到AMC1和AMC2,MCH2分别通过路径2和路径4连接到AMC1和AMC2。MCH1、MCH2、AMC1、AMC2的IPMB地址分别是A1、A2、A3、A4。在正常情况下,MCH1为主用,MCH2为备用,MCH1分别通过路径1和路径3与AMC1和AMC2通信。当如图所示的A处发生单点故障时,MCH1使用IPMB通道侦听命令对冗余总线通道发起通道侦听:MCH1经路径5向MCH2发出“请求1”的通道侦听报文,“请求1”的通道侦听报文的请求者地址是MCH1的地址A1、应答者地址是MCH2的地址A2、命令类型是通道侦听、数据中包含所侦听通道的目的地址(侦听地址),即AMC1的地址A3;MCH2收到“请求1”的通道侦听报文后,将继续进行侦听工作,MCH2经路径4向AMC2发出“请求2”通道侦听报文,“请求2”的通道侦听报文的请求者地址是MCH2的地址A2、应答者地址是AMC2的地址A4、命令类型是通道侦听、数据中包含侦听地址,即AMC1的地址A3。与此同时,AMC2还将收到MCH1经路径3发出的“请求3”通道侦听报文,因为“请求2”和“请求3”的侦听地址都是AMC1的地址A3,所以AMC2只经路径6向AMC1发出一个请求,即“请求4”通道侦听报文。

AMC1收到“请求4”通道侦听报文后,将经路径6向AMC2发出“应答4”应答报文,“应答4”的应答报文的请求者地址是AMC2的地址A4、应答者地址是AMC1的地址A3、命令类型是通道侦听、数据中包含请求确认信息。AMC2收到“应答4”后,将分别对“请求2”和“请求3”进行应答,“应答2”的应答报文的请求者地址是MCH2的地址A2、应答者地址是AMC2的地址A4、命令类型是通道侦听、数据中包含请求确认信息和经历路径:路径6;“应答3”的应答报文的请求者地址是MCH1的地址A1、应答者地址是AMC2的地址A4、命令类型是通道侦听、数据中包含请求确认信息和经历路径:路径6;MCH2在经过路径4收到“应答2”后,将通过路径5向MCH1发出“应答1”,“应答1”的应答报文的请求者地址是MCH1的地址A1、应答者地址是MCH2的地址A2、命令类型是通道侦听、数据中包含请求确认信息和经历路径:路径4+路径6;最终MCH1将从路径5和路径3收到两个应答报文,“应答1”和“应答3”,两个应答报文数据中的路径信息分别是:路径4+路径6、路径6,根据接收应答的路径和经历路径,MCH1检测到两条可用的冗余总线通道,即,通道1:路径5+路径4+路径6,通道2:路径3+路径6。

当然,MCH2在收到“请求1”后,也将经路径2向AMC1发出“请求5“,但该路径发生故障,该请求不会收到任何的应答。

表5是冗余总线通道侦听过程的命令报文汇总。

表5 冗余总线通道侦听命令报文汇总表

 

命令报文请求者地址应答者地址命令类型数据请求1A1A2通道侦听目的地址:A3请求2A2A4通道侦听目的地址:A3请求3A1A4通道侦听目的地址:A3请求4A4A3通道侦听目的地址:A3请求5A2A3通道侦听目的地址:A3应答1A1A2通道侦听请求确认+经历路径:路径4+路径6应答2A2A4通道侦听请求确认+经历路径:路径6应答3A1A4通道侦听请求确认+经历路径:路径6应答4A4A3通道侦听请求确认

在倒换到由先进夹层卡互连通道形成的冗余总线通道上通信后,由于IPMI命令报文只包含请求者地址(即主用MCH的地址)和应答者地址(即目的先进夹层卡的地址),则必须使处于该冗余总线通道上的目的先进夹层卡的对板能够透传发送给目的先进夹层卡的IPMI命令报文。如果备用MCH也处于该冗余总线通道上,则备用MCH也必须能够透传IPMI命令报文。因此,在倒换到由先进夹层卡互连通道形成的冗余总线通道上通信后,需要对交换控制模块及各AMC下发透传命令,命令所述交换控制模块及先进夹层卡将接收到的应答者地址不是其自身地址的报文透传。

以上所揭露的仅为本发明的较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号