首页> 中国专利> 对告警相关性分析系统进行验证的校验系统及方法

对告警相关性分析系统进行验证的校验系统及方法

摘要

本发明提供了一种用于对告警相关性分析系统进行验证的校验系统,包括:驱动模块204,用于仿真网元并构造预定的告警相关性规则表中的告警,并将告警上报给告警相关性分析系统;以及校验模块206,用于验证所述告警相关性分析系统针对所述告警的输出结果是否符合所述告警相关性规则表中的规则。本发明还提供了一种用于对告警相关性分析系统进行验证的校验方法。本发明克服了传统验证方式带来的真实设备局限性,提高了验证速度,以及使告警的递归关系和优先级得到了充分验证。

著录项

  • 公开/公告号CN101599874A

    专利类型发明专利

  • 公开/公告日2009-12-09

    原文格式PDF

  • 申请/专利权人 中兴通讯股份有限公司;

    申请/专利号CN200910151504.2

  • 发明设计人 刘金洋;

    申请日2009-06-29

  • 分类号H04L12/26(20060101);H04L12/24(20060101);G06F17/30(20060101);

  • 代理机构11240 北京康信知识产权代理有限责任公司;

  • 代理人余刚;吴孟秋

  • 地址 518057 广东省深圳市南山区科技南路55号

  • 入库时间 2023-12-17 23:10:12

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2012-02-08

    授权

    授权

  • 2010-02-03

    实质审查的生效

    实质审查的生效

  • 2009-12-09

    公开

    公开

说明书

技术领域

本发明涉及计算机和通信领域,特别涉及告警相关性的校验系统及方法。

背景技术

互联网络规模的日益扩大和对网络传输要求的不断提高,都在促进着通信技术的不断前进。在通信系统中,某个物理设备或软件模块出现异常时,都会发生用于传递故障信息的事件报告,此种事件报告即为告警。由于网络是由很多设备相互连接构成的,在实际网络运行中,一个部件的异常会引发网络的大量告警,也就是所谓的告警风暴。在这海量的告警中人工进行故障定位和处理,速度慢而且过于依赖维护人员的知识和经验,准确性和可靠性差。

这种情况迫切需要网管系统能够“智能”地进行告警相关性分析。而在告警相关性分析过程中,主要根据告警之间的关联规则来进行判断。在通常情况下,每个设备厂商都会根据设备告警产生的内部规律和工程经验预先人工定义一些关联规则,然后按照这些关联规则来过滤冗余告警,分析告警之间的相关性,区分出根源告警和衍生告警,帮助用户快速分析和定位网络故障,如图1所示。根源告警,顾名思义,是指网络中告警产生的源头,也就是由于发生了该告警,而产生了一系列的告警;衍生告警,就是根源告警引发的一系列告警,它随着根源告警的产生而产生,随着根源告警的消失而消失。举例说明:告警A产生了告警B,告警B又产生了告警C。那么在这种情况下,A是B和C的根源告警,B和C都为A的衍生告警。

不少设备厂商都已开发了告警相关性分析系统,如何验证告警相关性分析系统的实用性和有效性,该系统是否满足其预定义的所有相关性规则,成为网络运营商的一大难题。

目前验证方法通常是逐条在设备上构造每条规则对应的告警进行验证,这种方法存在以下缺点:

设备局限性:在现网环境中,各个站点都承载着大量业务。要想在设备上构造规则中的告警又不影响业务,是一件很困难的事情,因为规则中涉及到的告警基本都和业务有关,而且都是严重性等级较高的告警;此外,要在真实设备上构造告警,需要非常了解各厂家设备告警产生的内部规律,这对运营维护人员来说无疑是个挑战。

验证速度慢:遍历所有规则,在真实设备上搭建环境产生每条规则对应的告警,可想而知,耗费时间长,验证速度非常慢。

递归关系无法验证:规则一般是各厂商人工根据设备告警内部产生规律和工程经验预先定义,由于设备告警种类繁多,产生规律复杂加上规则数量庞大,所以人工只能整理出较直接的相关性关系。因此逐条规则验证时,递归关系无法验证。

优先级无法充分验证:假设告警E会产生告警D,告警F也会产生告警D,而且根据设备告警产生规律和维护经验,E引发D的可能性要高于F,也就是说在E,F和D同时存在的情况下,E是根源的优先级要高。而单条规则验证体现不出优先级。即使一次构造DEF三条告警进行验证,也只能验证出E和F的优先级。当存在递归优先级时,就无法验证充分。

因此,如何快速有效充分地验证各厂商的告警相关性分析系统是否满足其预定义的所有相关性规则成为一个棘手的问题。

因此,需要一种对告警相关性分析系统是否满足其预定义的所有相关性规则进行校验的解决方案,能够解决上述相关技术中的问题。

发明内容

本发明旨在提供一种快速有效地验证各厂商的告警相关性分析系统是否满足其预定义的所有相关性规则的校验系统,以克服传统验证方式带来的设备局限性等缺点。

根据本发明的一个方面,提供了一种用于对告警相关性分析系统进行验证的校验系统,包括:驱动模块,用于仿真网元并构造预定的告警相关性规则表中的告警,以及将告警上报给告警相关性分析系统;以及校验模块,用于验证所述告警相关性分析系统针对所述告警的输出结果是否符合所述告警相关性规则表中的规则。

其中,该校验系统还包括:数据库模块,用于存储预定告警相关性规则表。

其中,校验模块还用于记录告警相关性分析系统的输出结果是否满足预定告警相关性规则表中的所有规则。

其中,告警相关性规则表具有相关性规则矩阵数据结构,在矩阵数据结构中,第一列包含了告警规则表中的所有告警,从每一行的第二列到最后一个有值列列出对应于该行第一列的告警的所有根源告警,其中,第二列为第一优先级递归根源告警,第三列为第二优先级递归根源告警,以此类推,直到最后一个有值列,以及第二列到最后一个有值列中的每一列中的各列值相同。

其中,相同列值所在各行的第一列的列值的集合为对应于相同列值的告警所包含的全部衍生告警的集合,以及在第二列列值为空的情况下,告警为根源告警。

根据本发明的另一个方面,还提供了一种用于对告警相关性分析系统进行验证的校验方法,包括以下步骤:仿真网元并构造预定的告警相关性规则表中的告警,以及将告警上报给告警相关性分析系统;以及验证所述告警相关性分析系统针对所述告警的输出结果是否符合所述告警相关性规则表中的规则。

其中,该校验方法还包括以下步骤:记录告警相关性分析系统的输出结果是否符合预定告警相关性规则表中的所有规则。

其中,该校验方法还包括以下步骤:根据告警相关性规则表生成具有相关性规则矩阵数据结构的相关性规则数据矩阵。

其中,在相关性规则数据矩阵中,第一列包含了告警规则表中的所有告警,从每一行的第二列到最后一个有值列列出对应于该行第一列的告警的所有根源告警,第二列为第一优先级递归根源告警,第三列为第二优先级递归根源告警,以此类推,直到最后一个有值列,以及第二列到最后一个有值列中的每一列中的各列值相同,以及相同列值所在各行的第一列的列值的集合为对应于相同列值的告警所包含的全部衍生告警的集合。

优选地,对告警相关性分析系统的输出结果进行分析包括以下步骤:查看告警的根源告警是否是相关性规则矩阵中告警对应的第二列列值,或者查看第二列列值所对应的告警的衍生告警中是否包含了第二列列值对应的各第一列列值所对应的告警的集合,如果是,则确定所述第二列列值所对应的告警为所述告警的根源告警;清除第二列列值的告警使其变为历史告警;查看告警的根源告警是否是相关性规则矩阵中告警对应的第三列列值,或查看第三列列值的告警的衍生告警是否包含了第三列列值对应的各第一列列值所对应的告警的集合,如果是,则确定所述第三列列值所对应的告警为所述告警的根源告警;清除第三列列值的告警使其变为历史告警;以及以此类推,直到清除了所有有值列列值所对应的告警。

优选地,在第二列列值为空的情况下,告警为根源告警。

本发明通过仿真网元构造告警来验证各厂商的告警相关性分析系统是否满足其预定义的所有相关性规则,克服了传统验证方式带来的真实设备局限性,提高了验证速度,以及使告警的递归关系和优先级得到了充分验证。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是示出现有技术中告警相关性分析系统示意图;

图2是示出根据本发明一个实施例的校验系统的方框图;

图3是示出根据本发明一个实施例的校验方法的流程图;

图4是示出根据本发明另一个实施例的校验方法的流程图;

图5是示出根据本发明另一个实施例的告警的相关性矩阵确定方法的流程图;

图6是示出根据本发明的另一个实施例的告警的带权层次有向图的结构示意图;

图7是根据本发明另一个实施例的告警的相关性矩阵第一列阵元的结构示意图;

图8是示出根据本发明另一个实施例的相关性规则矩阵;

图9是示出根据本发明另一个实施例的清除了第二列后的相关性规则矩阵示意图;以及

图10是示出根据本发明另一个实施例的存在最后一列的相关性规则矩阵示意图。

具体实施方式

下面将结合附图来详细说明本发明的实施例。

图2是本发明校验系统的模块结构图,校验系统200包括三个模块:数据库模块202,驱动模块204和校验模块206。其中数据库模块202存储告警相关性规则表;驱动模块204仿真网元并制造相关性规则表中的告警;校验模块206对告警相关性分析系统输出的结果进行分析判定,来验证所有规则是否通过,并输出所有通过和不通过的项。

下面结合附图和具体实施例对本发明做进一步地详细描述。

首先摘录了小部分规则的具体实例,如表1所示,表1是本实施例原始的告警相关性规则表。

表1

将人工预定义的每条规则制成一个表格,分左右两栏,分别表示衍生告警和它可能的根源告警。每一栏又包含两列:来源点和告警原因。一个衍生告警可能有多个根源告警,所有可能的根源告警在表格中的先后顺序表示其引发衍生告警的优先级,顺序越前,其优先级越高。而且本表格只描述具有直接关系的告警。为了方便描述期间,本文将告警用一个大写字母来表示。

这里用大写字母来表示每一个告警,如下:A表示OA板的单板脱位告警;B表示STM-N光口的光模块未认证告警;C表示AU4的LOP告警;D表示STM-N光口的LOS告警;E表示MS-RDI;F表示MS-AIS;G表示AU4-AIS。简化后的告警相关性规则表如表2所示,表2是本实施例简化的告警相关性规则表。

表2

然后以两个实施例来说明本校验系统的详细处理过程。

图3是示出根据本发明一个实施例的校验方法的流程图。参照图3,根据该实施例的校验方法包括以下步骤:

步骤S302,数据库模块202存储告警相关性规则表,如表2所示;

步骤S304,在网管上创建网元,进行相关配置。在网管系统上创建各种设备类型的网元并插板,建立拓扑连接,配置多种类型的高低阶业务,目的在于覆盖规则表中的所有告警来源点;

步骤S306,驱动模块204仿真网元并按规则表逐行构造告警上报给告警相关性分析系统。在本实施例中,以告警相关性规则表的第一行为例进行说明:构造告警AD上报到告警相关性分析系统;

步骤S308,校验模块204逐行验证规则,直到所有行验证完毕。上步已构造出告警AD,告警相关性分析系统会自动进行相关性分析,校验模块204查看当前根源告警界面是否只显示A,查询A的衍生告警是否包含D(或者去当前衍生告警界面查看是否只显示D且D的根源告警是否是A),如有不符,则记录该行规则为不通过;

以此类推,重复步骤S306和S308,直到最后一行告警GC验证完毕。

从该实施例中可以看出,使用仿真网元逐行构造相关性规则表中的告警并验证,能够克服真实设备的局限性,而且大大节约了在真实设备上搭建环境产生对应告警的时间,提高了工作效率。但这种逐行验证法,验证速度不够快,仍然存在递归关系和优先级无法充分验证等缺点。本文中的另一个实施例则克服了这些问题。

图4是示出根据本发明另一个实施例的校验方法的流程图。参照图4,该实施例的校验方法包括以下步骤:

步骤S402,数据库模块202存储预定义的告警相关性规则表,如表2所示;

步骤S404,将规则表生成相关性规则矩阵并存储;

其中,相关性规则矩阵的生成算法如下:

图5为本发明告警的相关性矩阵确定方法的流程图,如图5所示,本发明告警的相关性矩阵确定方法包括以下步骤:

步骤S502,读取及解析所有已建立的告警关联规则,确定具有直接关联关系的告警的相关性。

以光网络为例说明告警的相关性。如表1所示,用A表示OA板的单板脱位告警;B表示N级同步传输模式(STM-N,SynchronousTransmission Module level N)光口的光模块未认证告警;C表示管理单元AU(Administrative Unit)4的指针丢失(LOP,Loss of Pointer)告警;D表示STM-N光口的信号丢失告警(LOS,Loss of Signal)告警;E表示复用段远端缺陷指示(MS-RDI,MultiplexSection-Remote Defect Indication)告警;F表示复用段告警指示信号(MS-AIS,Multiplex Section Alarm Indication Signal);G表示AU4告警指示信号(AU4-AIS)。用字母形式表示的告警的相关性表格如表2所示:

表2中的告警相关性为:A和B会引发D,A的优先级高于B;D会引发F;D和F会引发E,D的优先级高于F;D,F和C都会引发G,优先级顺序为D>F>C。

步骤S504,根据告警相关性生成带权层次有向图。生成带权层次有向图的原则是:衍生告警位于其对应的直接根源告警的下层,直接根源告警与其衍生告警之间通过单向箭头指示,其中,衍生告警对应于两个以上的直接根源告警时,所述两个以上的直接根源告警与所述衍生告警之间的单向箭头线按优先级顺序顺时针地从左到右排列,单向箭头线上标示有与其优先级对应的权值。告警在带权层次有向图中可以位于两个以上的层时,将该告警位于带权层次有向图中最下的那个层。

图6为本发明告警的带权层次有向图的结构示意图,如图6所示,A和B不是任何告警的衍生告警的根源告警,位于带权层次有向图的最上层,A和B会衍生D,而A的优先级高于B,那么将D作为A和B的子节点,A和B均指向D。由于A的优先级高于B,因此,将A放在B的左侧,并且将A→D的边的权值标示为1,将B→D的权值标上2。

D会引发F,那么就将F放在D的下一层,而且F就只有一个根源告警,所以权值为0,对于0权值不给出具体标识。D和F会引发E,D的优先级高于F。从图上可以看出D会导致E,而F也会导致E,而D、F所在的层不同,E相当于可以位于F所在的层,也可以位于F的下一层,根据前述的原则,E应该位于最下的层,即F的下一层。又由于D的优先级高于F,因此将F画在D顺时针方向的右手侧,同时标上对应权值。D、F和C均会引发G,而且优先级D>F>C。又由于D也会引发F,因此将G放在F的下层;没有任何告警会引发C,C不是任何告警衍生告警的根源告警,所以C放在最上层的右侧。同时将三条有向边标上相应权值:1、2和3。

虽然,本发明是示例性地说明告警的带权层次有向图的,但是,所有的告警之间的关系是雷同的,按前述的原则即能生成告警的带权层次有向图。

步骤S506,根据带权层次有向图生成相关性矩阵。

首先将带权层次有向图按从上到下的层次,每层次按从左到右的顺序搜索告警节点,将搜索出的所有告警节点依次作为矩阵的第一列。以图6所示的带权层次有向图为例,如图7所示,相关性矩阵的第一列的搜索结果为:ABCDFEG。

然后对相关性矩阵的第一列中的每一个告警阵元按入度顺时针方向从左到右地进行父节点搜索,将层次最高值最小的告警节点作为该告警阵元的第二列的告警阵元,即其第一优先级递归根源告警,层次次高权值次小的告警节点作为所述阵元告警的第三列的阵元,直到搜索完最右侧层次最低权值最大的父节点为止。在搜索过程中如果搜到重复的根源告警则跳过继续下一次搜索。下面以ABCDFEG每一行进行详细说明。

对于A、B和C,由于搜索不出任何父节点,因此这三条告警的根源告警为空。下面主要以G为例进行详细说明:G的入度按顺时针方向从左到右依次为D、F和C。先从D开始,搜索出A和B,那么将A作为第一优先级根源告警,因为其层次最高权值最小,B作为第二优先级根源告警,所位于的层次与A相同但权值较高;D作为第三优先级根源告警,所位于的层次最低。

再从F出发进行搜索,搜索到A、B和D,由于ABD均已搜索出,所以跳过,只将F作为第四优先级根源告警。

最后从C出发进行搜索,只搜索到C,那么将C作为其第五优先级根源。

所以G的根源告警从优先级和递归性上进行排列依次为:ABDFC。

由本发明告警的相关性矩阵确定方法的流程可以看出对于网络中所生成的所有告警,能简单清晰地表示出每条告警的第一优先级递归根源告警,第二优先级递归根源告警等,也能简单清晰地得出每条告警导致的所有衍生告警的集合,而且层层保证了根源告警的优先级和递归性,克服了传统单条规则存储带来的分析速度慢,递归关系不清晰和不能保证优先级等缺点。

生成的相关性规则矩阵如图8所示。该相关性规则矩阵具有以下特点:

1.第一列包含了规则中涉及到的所有告警;

2.从行的第二列到最后一个有值列完整地列出该行第一列对应告警的所有根源告警,而且非常清晰地保证和体现了各根源告警的优先级和递归性。第二列为第一优先级递归根源告警,第三列为第二优先级递归根源告警等等;

3.第二列值为空的说明其自身就是根源告警;

4.有值列的列值相同(第一列除外),相同列值的行的第一列的集合,即为该列值对应告警所包含的全部衍生告警集合。以图5为例,第二有值列的列值都是A,A所在的行的第一列的集合为DFEG,也就是说,A的所有衍生告警集合为DFEG;以及

5.相关性规则矩阵是一个下三角矩阵,可以节省一半的存储空间。

步骤S406,在网管上创建网元,进行相关配置。在网管系统上创建各种设备类型的网元并插板,建立拓扑连接,配置多种类型的高低阶业务,目的在于覆盖规则表中的所有告警来源点;

步骤S408,驱动模块204仿真网元并一次性构造所有告警。在本实施例中,构造相关性规则矩阵第一列包含的所有告警ABCDFEG上报到告警相关性分析系统。此外,还可以将本步构造出的大报文告警保存,再次使用的时候直接加载该报文向网管发送一下即可,方便以后使用;以及

步骤S410,校验模块204用“逐列消失法”验证所有规则。

其中,“逐列消失法”将在下面进行详细描述。

校验模块204使用相关性规则矩阵的逐列消失法来验证所有规则是否通过的步骤如下:在步骤S207中已使用驱动模块204构造了规则中的所有告警,告警相关性分析系统会自动进行相关性分析,校验模块204验证各告警的根源告警是否分析正确,也就是说,查看各告警的根源告警是否是相关性规则矩阵中其对应的第二列值(或者查看第二列值的告警的衍生告警中是否包含了其对应的第一列告警的集合),第二列值为空的说明其自身就是根源告警;然后在网管上对第二列值的告警进行清除和确认操作使其变为历史告警(当前告警变为历史告警时,当前告警界面上会自动刷新),选中剩下的所有当前告警进行重新分析,查看各告警的根源告警是否是相关性规则矩阵中其对应的第三列值(或第三列值的告警的衍生告警是否包含了其对应的第一列告警的集合),以此类推,直到所有列值的告警消失。在验证过程中,校验模块204会记录下所有通过和不通过的规则。

下面结合实施例来阐述验证的具体过程。

首先,在存在所有告警ABCDFEG的情况下,校验模块204查看当前根源告警界面是否只显示ABC三条告警,查询A的衍生告警是否包含了DFEG,查询B和C的衍生告警是否均为空(或者去当前衍生告警界面查看是否只显示DFEG四条告警且每条告警的根源告警是否都是A),如有不符合的,记录不通过的规则。该过程用来验证各条告警的第一优先级递归根源告警的分析是否正确。

然后,校验模块204将A告警进行清除确认操作使其变为历史告警。由于使用的是仿真网元,A告警的消失不会引起其他告警的消失,所以目前存在的当前告警集合是BCDFEG,如图9所示。选中这些告警进行重新分析,查看刷新后的当前根源告警界面上是否只显示BC,且B的衍生告警是否包含了DFEG,C的衍生告警是否为空(或者去当前衍生告警窗口查看是否只显示DFEG且每条告警的根源告警是否都是B),如有不符合的,记录不通过的规则。该过程用来验证各条告警的第二优先级递归根源告警的分析是否正确。

然后,校验模块204将B,D和F依次消失,验证过程同上,不再赘述。ABDF告警均消失后,网管上只剩下CEG告警,如图10所示。选中这三条告警进行重新分析,查看当前根源告警界面是否只显示CE,且C的衍生告警是G,E的衍生告警为空(或者去当前衍生告警窗口查看是否只显示G且其根源告警是C),如有不符合的,记录不通过的规则。该过程用来验证各条告警的最后优先级递归根源告警的分析是否正确。

最后将C告警进行清除确认操作使其变为历史告警。目前存在的当前告警集合是EG,选中这两条告警进行重新分析。查看刷新后的当前根源告警界面上是否显示EG且其衍生告警均为空(或者去当前衍生告警查看是否是空)。该过程用来验证没有衍生关系的告警的分析是否正确。直到相关性规则矩阵的从第二列开始的所有列均消失,验证过程结束。在此过程中,校验模块204会自动记录所有通过和不通过的规则。

从该实施例可以看出,通过仿真网元一次性构造所有告警和利用相关性规则矩阵的“逐列消失法”进行验证,不仅克服了真实设备的局限性,充分验证了优先级和递归性,而且验证快速便捷,克服了传统验证方式的所有主要缺点。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号