異常検知と予知保全
異常検知と予知保全はシステムをモニタリングするという部分は同じですが目的が異なります。すでに発生した問題を見つけるのが異常検知(Anomaly Detection)、まだ問題の起きていない状態から問題の発生を予測するのが予知保全(Predictive Maintenance)です。異常検知という言葉に、予知保全の意味合いも含めて使われていることもよくあるので、混同しないように気をつけましょう。
この異常検知や予知保全は、分野を問わず、近年よく耳にするようになりましたが、課題も多く、なかなか運用が定着しないというケースも多く見られます。
「いつもと違う」 ≠ 「異常検知」
一度に大量のデータを扱うことができるようになった現在では、機械学習などを利用することで、簡単に「通常と違う状態」を検出できるようになりました。その一方で、大量のアラートが発生し、本当に知りたい情報が埋もれてしまうという問題も起きるようになりました。これは通常稼働時のデータだけを利用して判断をしようとしている場合に起こる問題で、少しでも通常と異なれば、それらをすべて異常とみなしてしまうためです。シンプルなデータだけで、判断できるというメリットこそありますが、逆に言えば、これ以上精度を高めるすべがないと言うことにもなります。
このような従来型の異常検知の問題点を解決し、その利用シーンを更に推し進める技術の一つとして注目されているのが、AIOpsです。
AIOpsプラットフォームが提供する本当に使える異常検知
- 騒々しい異常通知(アラートノイズ)をブロックし、必要なものだけをインシデントに変換
- 閾値の自動計算と閾値変更の影響シミュレーション(What-IF分析)
- 重大なインシデントを判断し優先度を設定
- 発生したインシデントに関する解決の糸口や根本原因の特定
- インシデントの自動回避と問題解決処理の自動実行(セルフ・ヒーリング)
- 機械学習モデルのアップデートおよびデプロイマネージメント
- グラフィカルな開発プラットフォーム