首页> 外文期刊>電子情報通信学会技術研究報告 >大規模システム向け障害分析を可能にする最尤分析の拡張
【24h】

大規模システム向け障害分析を可能にする最尤分析の拡張

机译:最大似然分析的扩展可实现大规模系统的故障分析

获取原文
获取原文并翻译 | 示例
       

摘要

We proposed, in previous paper, a new root cause analysis method in which fault propagation models are calculated with maximum likelihood analysis. In this method, however, learning of fault propagation patterns and analysis with the propagation model takes time with O(N~2) where N is product of the number of components and faults. We propose, in this paper, a new maximum likelihood analysis algorithm. The algorithm assumes the probability of fault propagation among types of fault components and that of fault propagation among components are independent. In the proposed algorithm, the learning phase and the analysis phase take O(1) times.%分散システムでは,ひとつの障害から複数の障害へと派生,多数のイベントが発生するため,障害原意の特定が困難である.過去のイベントログから最尤分析を行うことで,障害の派生パターンを学習,それをもとに根本障害を分析する技術の研究を行ってきた.しかし,その方法では,管理システムを構成するコンポーネント数の二乗に比例して学習時聞及び分析時間が増加するため,大規模システムに適用することが困難であった.本稿では,コンポーネント間の障害派生関係と,障害種別ごとの障害派生関係は確率的に独立と仮定することで,学習時間,障害分析時間ともに低減させるアルゴリズムを捷案する.これにより,障害派生パターンの学習及びパターンを用いた障害分析はコンポーネント数に対して定数オーダで計算が可能であることを示す.
机译:我们在先前的论文中提出了一种新的根本原因分析方法,其中使用最大似然分析来计算故障传播模型,但是在这种方法中,故障传播模式的学习和传播模型的分析花费的时间为O(N〜2 ),其中N是组件数量和故障数量的乘积。在本文中,我们提出了一种新的最大似然分析算法。该算法假设故障类型在组件之间传播的概率与组件之间的传播概率是独立的。在提出的算法中,学习阶段和分析阶段占O(1)%。在分布式系统中,由于一个故障到多个故障会产生许多故障,因此很难确定故障的原始含义。在那儿。我们通过从过去的事件日志中执行最大似然分析,研究了故障的派生模式,并研究了基于该技术分析潜在故障的技术。但是,由于学习时间和分析时间与构成管理系统的组件数量的平方成正比增加,因此该方法难以应用于大型系统。在本文中,我们提出了一种算法,该算法假设组件之间的故障推导关系和每种故障类型的故障推导关系是随机独立的,从而减少了学习时间和故障分析时间。结果表明,对于部件数量,可以以恒定的顺序计算出源自故障的模式的学习和使用该模式的故障分析。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号