大規模システム向け障害分析を可能にする最尤分析の拡張(奨励講演,障害検知・解析)
スポンサーリンク
概要
- 論文の詳細を見る
分散システムでは,ひとつの障害から複数の障害へと派生,多数のイベントが発生するため,障害原意の特定が困難である.過去のイベントログから最尤分析を行うことで,障害の派生パターンを学習,それをもとに根本障害を分析する技術の研究を行ってきた.しかし,その方法では,管理システムを構成するコンポーネント数の二乗に比例して学習時間及び分析時間が増加するため,大規模システムに適用することが困難であった.本稿では,コンポーネント間の障害派生関係と,障害種別ごとの障害派生関係は確率的に独立と仮定することで,学習時間,障害分析時間ともに低減させるアルゴリズムを提案する.これにより,障害派生パターンの学習及びパターンを用いた障害分析はコンポーネント数に対して定数オーダで計算が可能であることを示す.
- 2009-07-02
著者
関連論文
- 外部環境の変動を考慮した障害分析技術の提案(ネットワーク管理,情報通信マネジメント,一般)
- サポートベクターマシンを用いた事例ベース障害検出(NW管理,次世代NWアーキテクチャ,次世代NWのオペレーションアーキテクチャ,トラヒック計測・モデリング・品質,オーバレイネットワーク,次世代NWサービス品質,一般)
- 潜在的な派生関係を有する障害に対する故障分析手法(ネットワーク管理・オペレーション)
- 大規模システム向け障害分析を可能にする最尤分析の拡張(奨励講演,障害検知・解析)
- APNOMS2009報告(ライフログ活用技術,オフィス情報システム,情報通信マネジメント,一般)
- APNOMS 2009報告(ライフログ活用技術,オフィス情報システム,情報通信マネジメント,一般)
- 最尤分析を用いた派生障害に対する障害分析(次世代ネットワークアーキテクチャ,次世代ネットワークのオペレーションアーキテクチャ,トラヒック計測・モデリング・品質,オーバレイネットワーク,一般)
- B-14-20 イベントコリレーションにおけるルール獲得手法評価法の提案(B-14.情報通信マネジメント,一般セッション)
- ルールベース障害検出システムの実装例と評価(試作・評価・実用化,サービス管理,ビジネス管理,料金管理,及び一般)
- ルールベース障害検出システムの実装例と評価(試作・評価・実用化,サービス管理,ビジネス管理,料金管理,及び一般)